Implementation and Performance Analysis of Mixed Precision-based CNN Inference | 임승호 교수 연구실 | 한국외국어대학교 컴퓨터공학부

임승호 교수 연구실

서비스 플랜

연구실 검색

프로젝트 공고

정부 과제 추천

AI 기반 기업 서칭

홈

기본 정보

연구 분야

프로젝트

논문

구성원

article|

인용수 0

·2023

Implementation and Performance Analysis of Mixed Precision-based CNN Inference

Jongeun Lee, Kyung-Bin Jang, Seung‐Ho Lim

The Journal of Korean Institute of Information Technology

초록

최근 딥러닝 기술은 고정밀도 모델로 인해서 정확도가 높아지고 있으나, 복잡한 네트워크의 깊이와 파라미터의 수 증가로 인해서 연산에 필요한 자원 소모 및 프로세싱 시간이 증가한다. 이러한 네트워크 복잡도는 IoT 시스템 및 모바일 시스템과 같은 임베디드 시스템에서 딥러닝 연산을 수행하는 오버헤드가 된다. 따라서, 양자화와 같은 경량 시스템에 맞는 딥러닝 모델을 위한 경량화 연구가 많이 이루어져 왔다. 양자화를 적용하면 정확도 손실이 많이 발생하기 때문에 파라미터를 혼합해서 사용하는 Mixed Precision 적용이 대안이 되고있다. 본 논문에서는 임베디드 시스템에서 Mixed Precision 기반의 CNN 딥러닝 모델의 추론 연산 방식을 구현하였으며, Mixed Precision 적용에 대한 성능 분석을 하였다. 실험 결과, 연산 복잡도가 높은 몇몇 계층에 양자화를 적용하면 정확도의 손실을 줄이면서 추론 시간이 14%~20%가량 줄어듦을 확인할 수 있었다.

키워드

Computer scienceInferenceMixed modelAccuracy and precisionArtificial intelligenceMachine learningStatisticsMathematics

타입

article

IF / 인용수

- / 0

원문

https://doi.org/10.14801/jkiit.2023.21.12.77

게재 연도

2023

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)