Target Capacity Filter Pruning Method for Optimized Inference Time Based on YOLOv5 in Embedded Systems | 김용우 교수 연구실 | 한국교원대학교 기술교육과

|김용우 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

Article|

인용수 15

·2022

Target Capacity Filter Pruning Method for Optimized Inference Time Based on YOLOv5 in Embedded Systems

Jihun Jeon, Jaemyung Kim, Jin-Ku Kang, SungTae Moon, Yongwoo Kim

IF 3.9 (2022) IEEE Access

초록

최근 컴퓨터 비전 분야에서 우수한 성능을 보이는 합성곱 신경망(CNNs)이 주목받고 있다. 그러나 정확도를 높이기 위해 네트워크를 더 넓게 만들수록 매개변수 수와 연산 비용이 지수적으로 증가한다. 따라서 제한된 자원, 연산 성능 및 전력을 갖춘 임베디드 환경에서는 딥러닝 네트워크를 사용하기가 어렵다. 또한 CNN은 추론(inference)에 많은 시간이 소요된다. 이러한 문제를 해결하기 위해 본 연구에서는 목표 용량 및 추론 가속을 위한 최적의 네트워크 아키텍처를 제공하는 실용적인 필터 가지치기(filter pruning) 방법을 제안한다. 추론 시간과 FLOPs 간의 상관관계를 규명한 후, 원하는 추론 시간을 갖는 네트워크를 생성하는 방법을 제안하였다. 제안된 필터 가지치기 방법의 성능을 평가하기 위해 다양한 객체 검출(object detection) 데이터셋을 사용하였다. 가지치기된 네트워크의 추론 시간은 NVIDIA Jetson Xavier NX 플랫폼을 사용하여 측정하고 분석하였다. 그 결과, PASCAL VOC 데이터셋에서 YOLOv5 네트워크의 매개변수 수 및 FLOPs를 각각 30%, 40%, 50% 가지치기했을 때 mAP는 각각 0.6%, 2.3%, 2.9% 감소한 반면, 추론 시간은 각각 14.3%, 26.4%, 34.5% 개선되었다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

FLOPSInferenceComputer sciencePruningConvolutional neural networkArtificial intelligencePascal (unit)Filter (signal processing)Deep learningMachine learning

타입

Article

IF / 인용수

3.9 / 15

원문

https://doi.org/10.1109/access.2022.3188323

게재 연도

2022