저장대역 병목을 줄이기 위해 near-storage 가속기에서 파라미터 업데이트와 attention·KV 캐시 연산을 수행하는 LLM 오프로딩 연구
PIM-enabled DIMM에서 인터-PE 집단통신과 그래프의 비정형 산발-수집 접근을 in-memory에서 처리해 메모리 병목을 완화하는 연구
GPU 비친화 연산을 진단해 메모리 접근과 워크로드를 재구성하고, 멀티-GPU 확장 및 하드웨어·신경망 공동 최적화를 수행하는 가속 연구