서울대학교 전기·정보공학부 이진호 교수
이진호 연구실은 전기·정보공학부에서 GPU와 메모리 근접 구조를 활용한 대규모 연산 가속을 수행합니다. storage-offloaded 학습과 offline long-context 추론에서 발생하는 I/O 병목을 near-storage processing으로 완화하기 위해 attention near storage, KV cache I/O 최적화, 전송/버퍼 운용 구조를 설계합니다. 또한 PIM-enabled DIMM과 in-memory scatter-gather를 통해 비정형 그래프 처리의 트래픽과 접근 비효율을 줄이는 하드웨어 구조를 연구합니다. 더불어 GPU 친화적 알고리즘 재구성과 멀티-GPU 스케일링, differentiable accelerator/network co-exploration을 함께 다루며 다양한 응용 워크로드로 확장합니다.
5개년 연도별 논문 게재 수
5개년 연도별 피인용 수
인공신경망과 연산 가속기 구조 통합 탐색 장치 및 방법