기본 정보
연구 분야
프로젝트
발행물
구성원
The 43rd IEEE International Conference on Computer Design (ICCD 2025)
Throughput-Oriented LLM Inference via KV-Activation Hybrid Caching with a Single GPU
구분
국외
국가
미국
컨퍼런스명
The 43rd IEEE International Conference on Computer Design (ICCD 2025)
발표 제목
Throughput-Oriented LLM Inference via KV-Activation Hybrid Caching with a Single GPU
기관명
IEEE
참여 연도
2025
상세 설명
IEEE