프로세서와 메모리 간의 메모리 대역폭은 성능을 제한하며, 특히 데이터 집약적 응용이 부상하는 상황에서 그 영향이 두드러진다. 이러한 문제를 해결하기 위해 메모리 내 처리(in-memory processing)를 지원하는 방안이 활발히 연구되고 있다. 대부분의 PIM(Processing-in-Memory) 플랫폼은 계산에 앞서 모든 입력 데이터를 준비하는데, 이는 데이터 준비 과정에서 발생하는 상당한 오버헤드 때문이다. 또한 데이터 중복으로 인해 멀티채널 메모리 시스템에서는 이러한 오버헤드가 훨씬 더 크다. 본 논문에서는 멀티채널 메모리 시스템에서 PIM 연산을 지원하기 위해 비용 효율적인 DMA 오프로딩(offloading) 방법론을 개발하였다. 채널 간 데이터 공유 오버헤드를 최소화하였으며, DNN 응용의 실행에서 기존의 단일 채널 PIM 아키텍처 대비 최대 1.79배의 성능 향상을 달성하였다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.