서울대학교 컴퓨터공학부 유승주 교수
유승주 연구실은 내장형 시스템과 인공지능 시스템 최적화를 목표로 하드웨어-소프트웨어 공동설계와 모델 경량화 방법론을 함께 수행합니다. LLM 배포를 위해 rotation 기반 비균일 양자화와 calibration-free KV cache 압축 같은 저비트 추론 최적화를 연구합니다. 동시에 PIM(Processing-in-Memory) 및 텐서 수축 프로세서 같은 컴퓨터 아키텍처 관점에서 데이터 레이아웃, pruning, 계산 재사용을 설계하여 메모리 병목을 완화하는 연구를 수행합니다. 추가로 Dense-SfM을 통해 멀티뷰 3D 재구성에서 dense matching과 트랙 확장을 활용하는 컴퓨터 비전 연구도 병행합니다.
5개년 연도별 논문 게재 수
5개년 연도별 피인용 수
적응적으로 양자화를 수행하는 학생 모델 생성 장치 및 방법
뉴럴 네트워크 가속 장치 및 그의 연산 방법
뉴럴 렌더링을 위한 저정밀도 하드웨어 가속기 및 그 동작 방법