FPGA-Based Accelerator for Rank-Enhanced and Highly-Pruned Block-Circulant Neural Networks | 권은지 교수 연구실 | 국민대학교 인공지능학부

권은지 교수 연구실

홈

기본 정보

연구 분야

논문

구성원

article|

인용수 1

·2023

FPGA-Based Accelerator for Rank-Enhanced and Highly-Pruned Block-Circulant Neural Networks

Haena Song, Jongho Yoon, Dohun Kim, Eunji Kwon, Tae-Hyun Oh, Seokhyeong Kang

초록

자원 제약이 있는 임베디드 시스템에 딥 신경망을 배치하기 위해 수많은 네트워크 압축 방법이 제안되어 왔다. 그중 블록 순환 행렬(block-circulant matrix, BCM) 압축은 가속과 압축 모두를 위한 유망한 하드웨어 친화적 방법 중 하나이다. 그러나 BCM 압축에는 몇 가지 한계가 있다. (i) 순환 행렬의 구조적 특성으로 인한 제한된 표현력, (ii) 압축 파라미터의 제한, (iii) BCM으로 압축된 네트워크 가속기를 위한 데이터플로의 특화 필요성이다. 본 논문에서는 이러한 한계를 극복하기 위해 순위 향상 및 고도로 가지치기된 블록 순환 행렬 압축(rank-enhanced and highly-pruned block-circulant matrices compression, RP-BCM) 프레임워크를 제안한다. RP-BCM은 두 단계로 구성되며, Hadamard-BCM과 BCM 단위 가지치기(BCM-wise pruning)로 이루어진다. 또한 BCM 단위 희소성을 활용하여 높은 병렬성을 확보하기 위한 처리 요소(processing element) 설계를 위한 전용 스킵 스킴(skip scheme)을 도입한다. 더 나아가, 자원 제약이 있는 FPGA에서 BCM으로 압축된 네트워크를 위한 특화 데이터플로를 제안한다. 그 결과, 제안된 방법은 ImageNet에서 ResNet-50에 대해 각각 92.4% 및 77.3%의 파라미터 감소와 FLOPs 감소를 달성한다. 또한 제안된 하드웨어 설계는 GPU와 비교하여 ImageNet에서 ResNet-18에 대해 Xilinx PYNQ-Z2 FPGA 보드에서 에너지 효율을 $3.1 \times$ 향상시킨다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Computer scienceField-programmable gate arrayCirculant matrixDataflowPruningBlock (permutation group theory)Kernel (algebra)Parallel computingHardware accelerationArtificial neural network

타입

article

IF / 인용수

- / 1

원문

http://dx.doi.org/10.23919/date56975.2023.10137111

게재 연도

2023

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)