HILOS: 장문 컨텍스트 LLM의 오프라인 추론을 위한 비용 효율적인 근(近)저장소 처리 솔루션 이 아티팩트는 배치된 LLM 추론을 위해 설계된 고처리량 근(近)저장소 처리 시스템 HILOS의 구현을 제공한다. 실험 결과의 재현을 용이하게 하기 위해, 전체 소스 코드를 제공한다. 이 아티팩트는 (1) FPGA 바이너리의 합성과 (2) 전체 추론 파이프라인의 배포를 지원한다. 자세한 논거는 아티팩트에 포함된 README 파일을 참조하라. 인용문( Citation ) 연구에 이 코드를 사용한다면, 다음 논문을 인용해 주기 바란다. ```bibtex@inproceedings{hilos, title={HILOS: A Cost-Effective Near-Storage Processing Solution for Offline Inference of Long-Context LLMs}, author={Jang, Hongsun and Song, Jaeyong and Shin, Changmin and Noh, Si Ung and Jung, Jaewon and Park, Jisung and Lee, Jinho}, booktitle={Proceedings of the 31st ACM International Conference on Architectural Support for Programming Languages and Operating Systems}, year={2026}}```
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.