PIM 및 텐서 수축 프로세서 기반 에너지 효율 AI 가속

Energy-efficient AI acceleration via PIM and tensor contraction processors

연구 내용

PIM(Processing-in-Memory)과 텐서 수축 프로세서 아키텍처를 설계하여 대규모 연산에서 데이터 지역성과 재사용을 높이는 하드웨어-소프트웨어 공동설계 연구

본 연구는 신경 렌더링과 AI 추론에서 메모리 접근이 연산 효율을 제한하는 문제를 해결하기 위해 PIM 기반 가속과 소프트웨어 최적화를 함께 수행합니다. NeRF-PIM에서는 voxel grid의 trilinear interpolation과 dot product 연산을 대상 연산으로 두고, 랜덤 voxel 접근이 초래하는 내부 대역폭 저하를 완화하기 위한 데이터 레이아웃을 구성합니다. 또한 occupancy-grid-aware pruning과 one-voxel two-sampling으로 빈 공간의 중복 계산을 줄이고, per-voxel dot product 결과 재사용을 통해 메모리 트래픽을 감소시킵니다. RNGD에서는 다양한 tensor contraction 패턴에 대응하는 유연한 처리 요소와 switch 기반 fetch 네트워크, 버퍼 기반 reuse를 활용해 성능과 에너지 효율을 함께 최적화합니다.

관련 프로젝트

3건

연구 흐름

연구는 2022년 에너지 효율 AI 칩 관련 특집 소개를 통해 아키텍처 관점의 최적화 방향을 정리한 이후, 2024년에는 NeRF의 메모리 비효율을 PIM 관점에서 재구성하는 하드웨어-소프트웨어 공동설계를 수행했습니다. voxel grid 연산의 locality를 개선하기 위한 데이터 레이아웃과, pruning 및 1V2S와 같은 계산/메모리 절감 기법을 소프트웨어에서 함께 구현하며 실제 HBM-PIM 장치를 사용한 평가로 성능 향상을 검증했습니다. 2025년에는 텐서 수축 연산 패턴 전반을 효율적으로 처리하기 위한 두 번째 세대 tensor contraction processor(RNGD)를 제안하고, 회로 스위치 fetch, 입력 broadcasting, 버퍼 reuse를 통해 다양한 텐서 형상에 대한 실행 효율을 확장하는 흐름으로 이어졌습니다. 과제는 2021-2024년 기간의 수직 적층소자 기술 기반 AI 가속 시스템 개발과 연동되어 아키텍처 최적화로 축적되었습니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

HBM-PIM 기반 뉴럴 렌더링 가속
Voxel 연산 데이터 레이아웃 최적화
삼선 보간 연산 가속
Dot product 재사용 최적화
Occupancy 기반 프루닝
One-voxel two-sampling 가속
텐서 수축 연산 프로세서 설계
Switch 기반 fetch 네트워크 최적화
입력 broadcasting 효율화
에너지 효율 칩 설계 가이드라인