HILOS: 장문맥 LLM의 오프라인 추론을 위한 비용 효율적인 근접-저장 처리 솔루션 초록 본 아티팩트는 배치(batch)된 LLM 추론을 위해 설계된 고처리량 near-storage 처리 시스템인 HILOS의 구현을 제공한다. 본 연구의 실험 결과를 재현할 수 있도록 전체 소스 코드를 제공한다. 본 아티팩트는 (1) FPGA 바이너리의 합성 및 (2) 전체 추론 파이프라인의 배포를 지원한다. 자세한 논거는 아티팩트에 포함된 README 파일을 참조하라. 인용 본 연구에서 본 코드를 사용하는 경우, 다음 논문을 인용해 주기 바란다: ```bibtex@inproceedings{hilos, title={HILOS: A Cost-Effective Near-Storage Processing Solution for Offline Inference of Long-Context LLMs}, author={Jang, Hongsun and Song, Jaeyong and Shin, Changmin and Noh, Si Ung and Jung, Jaewon and Park, Jisung and Lee, Jinho}, booktitle={Proceedings of the 31st ACM International Conference on Architectural Support for Programming Languages and Operating Systems}, year={2026}}```
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.