지금 회원가입하고
10% 할인 혜택 받으세요!
로그인 시 맞춤형 서비스가 제공됩니다
DRAM/메모리 내부 연산과 토큰·희소성 중심 데이터 경로를 설계하여 LLM 및 DNN 추론의 전력과 대역폭 병목을 완화하는 연구
Genetic Algorithm 기반 NAS와 분포 보존 양자화, 무감독 도메인 분리·LoRA 적응으로 데이터 효율적 경량 모델을 만드는 연구
어텐션 계층·관계 구조를 분해·직교화하여 압축하고, KV cache를 확률적 분포로 압축해 장문 추론 효율을 높이는 연구