GraNDe: Efficient Near-Data Processing Architecture for Graph Neural Networks | 이어진 교수 연구실 | 인하대학교 본교(제1캠퍼스) 인공지능공학과

|이어진 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

Article|

인용수 9

·2023

GraNDe: Efficient Near-Data Processing Architecture for Graph Neural Networks

Sungmin Yun, Hwayong Nam, Jaehyun Park, Byeongho Kim, Jung Ho Ahn, Eojin Lee

IF 3.6 (2023) IEEE Transactions on Computers

초록

그래프 신경망(Graph Neural Network, GNN) 모델은 그래프 데이터 해석에서 높은 정확도를 보이기 때문에 주목받고 있다. GNN 모델의 주요 구성 요소 중 하나는 집계(aggregation)로, 각 노드에 인접한 노드들에 해당하는 특징 벡터를 수집하고 평균 내는 과정을 수행한다. 집계는 인접 행렬과 특징 행렬을 곱함으로써 작동한다. 그러나 많은 현실적인 데이터셋에서 두 행렬의 크기는 온칩 캐시 용량을 초과하며, 인접 행렬은 매우 희소하다. 이러한 특성은 데이터 재사용을 거의 불가능하게 만들어 집계 과정에서 주기억장치에 대한 집중적인 접근이 발생한다. 따라서 집계는 메모리 집약적 특성을 가지며 전체 실행 시간의 대부분을 지배한다. 본 논문에서는 DRAM 데이터패스 근처에 NDP 모듈을 배치하여 랭크 수준 병렬성(rank-level parallelism)을 활용함으로써 메모리 집약적인 집계 연산을 가속하는 NDP 아키텍처인 GraNDe를 제안한다. GraNDe는 버퍼 칩을 메모리 채널 경로 사이에 삽입하여 호스트 프로세서에서의 전처리/후처리와 NDP 모듈에서의 감소(reduction)가 동시에 수행되도록 함으로써 대역폭 활용을 극대화한다. 피연산자 행렬의 DRAM 랭크에 대한 선호 데이터 매핑(preferred data mappings)을 탐색함으로써, GraNDe는 각 레이어의 차원과 메모리 시스템 구성에 따라 최적 매핑을 적용하는 적응형 행렬 매핑(adaptive matrix mapping)을 지원하도록 설계되었다. 또한 인접한 노드 간의 인접성(adjacency)을 고려한 타일링(tiling)을 활용하여 인접 행렬 데이터의 전송 시간을 줄이고 특징 벡터 데이터의 재사용성을 향상시키기 위한 adj-bundle 브로드캐스팅과 재-타일링(re-tiling) 최적화를 제안한다. GraNDe는 평균적으로 GCN 집계에 대해 기본 시스템과 GCN을 위한 최신 NDP 아키텍처 대비 각각 3.01× 및 1.69×의 성능 향상을 달성하며, 각각 최대 $4.00 \times$ 및 $1.98 \times$ 의 속도 향상을 보인다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Computer scienceParallel computingAdjacency matrixDatapathAdjacency listCacheDramMemory bandwidthGraphTheoretical computer science

타입

Article

IF / 인용수

3.6 / 9

원문

https://doi.org/10.1109/tc.2023.3283677

게재 연도

2023