권은지 교수 연구실
기본 정보
연구 분야
논문
구성원
article|
·
인용수 3
·2024
RL-PTQ: RL-based Mixed Precision Quantization for Hybrid Vision Transformers
Eunji Kwon, Minxuan Zhou, Weihong Xu, Tajana Rosing, Seokhyeong Kang
초록

기존의 양자화 접근법은 낮은 비트 폭으로 하이브리드 컨볼루션 및 트랜스포머 모델을 압축할 때 상당한 정확도 손실을 초래한다. 본 논문은 강화학습(RL)을 활용하는 새로운 사후 학습 양자화(PTQ) 프레임워크인 RL-PTQ를 제안한다. 우리는 계층을 그룹화하고 하이브리드 트랜스포머의 양자화에서 발생하는 문제를 다룸으로써, 혼합 정밀도를 위한 양자화 구성에 최적의 비트 폭 및 옵저버를 결정하는 데 초점을 둔다. 이전의 PTQ 방법들 [5--7]과 비교하여 MobileViTs에서 가장 높은 양자화 정확도를 달성하였다. 또한 PIM(Processing In Memory) 아키텍처에서의 우리의 양자화 모델은 최신 PIM 가속기 [15] 및 GPU에 비해 각각 기준 모델 대비 에너지 효율이 10.1× 및 22.6× 향상되었다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Computer scienceQuantization (signal processing)TransformerComputer visionArtificial intelligenceEngineeringElectrical engineering
타입
article
IF / 인용수
- / 3
게재 연도
2024

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.