박성경 교수 연구실
기본 정보
연구 분야
프로젝트
논문
구성원
article|
인용수 4
·2022
Spatial Data Dependence Graph Based Pre-RTL Simulator for Convolutional Neural Network Dataflows
Jooho Wang, Sungkyung Park, Chester Sungchung Park
IF 3.9 (2022) IEEE Access
초록

본 논문에서는 레지스터-전송-수준(register-transfer-level, RTL) 설계 이전에 합성곱 신경망(convolutional neural network, CNN) 데이터플로우의 전력, 성능, 면적을 예측하기 위한 새로운 사전-RTL 시뮬레이터를 제안한다. 제안된 시뮬레이터에서는 공간 데이터 의존성 그래프(spatial data dependence graph, SDDG)를 구현하기 위해 새로운 접근법을 채택하였으며, 각 처리 요소(processing element, PE)의 상태를 추적함으로써 명령 간 의존성과 함께 특정 데이터플로우를 모델링할 수 있다. 또한 제안된 사전-RTL 시뮬레이터는 지연(latency)과 대역폭(bandwidth)과 같은 메모리 제약이 미치는 영향을 평가할 수 있게 한다. 제안된 사전-RTL 시뮬레이터에서 가정한 지연 비민감 및 대역폭 비민감 PE 컨트롤러는 메모리 제약과 무관하게 기능적 정확성과 최대 성능을 모두 보장한다. 특히, 국소 메모리 대역폭의 최적 분배 방법은 등분배 방법과 비교하여 가속기 실행 시간을 최대 37.6%까지 감소시킬 수 있음을 보인다. 가중치 고정(weight stationary, WS) 및 행 고정(row stationary, RS) 데이터플로우의 경우, 가속기 성능은 메모리 제약에 밀접하게 의존한다. 시뮬레이션 결과는 또한 데이터플로우 간 상대 성능이 합성곱 층의 층 형상(layer shape)에 따라 달라짐을 보여준다. 예를 들어 AlexNet의 표준 합성곱 층에서 동일한 하드웨어 면적을 가정할 때, 메모리 지연이 충분히 높으면 WS 데이터플로우는 RS 데이터플로우에 비해 어떠한 성능 향상도 제공하지 못한다. 또한 특정 시점에 로드되는 가중치의 수가 제한되므로, WS 데이터플로우는 입력 활성(input activation)을 충분히 재사용하지 못하여 국소 메모리 접근(local memory accesses)이 증가한다. 더 나아가 MobileNet의 심층 분리 합성곱(depth-wise convolutional) 층에서는 WS 데이터플로우가 큰 메모리 지연이 존재하더라도 대체로 RS 데이터플로우보다 우수한 성능을 보이는 경향이 있다. 소스 코드는 다음 GitHub 저장소에서 제공된다: https://github.com/SDL-KU/SDDGSim.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Computer scienceConvolutional neural networkGraphSpatial networkData modelingTheoretical computer scienceComputational scienceArtificial intelligenceComputer architectureDatabase
타입
article
IF / 인용수
3.9 / 4
게재 연도
2022

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.