Grouped Sequency-arranged Rotation: Optimizing Rotation Transformation for Quantization for Free | 유승주 교수 연구실 | 서울대학교 컴퓨터공학부

유승주 교수 연구실

서비스 플랜

연구실 검색

프로젝트 공고

정부 과제 추천

AI 기반 기업 서칭

홈

기본 정보

연구 분야

프로젝트

논문

구성원

preprint|

인용수 0

·2025

Grouped Sequency-arranged Rotation: Optimizing Rotation Transformation for Quantization for Free

Euntae Choi, Sumin Song, Woosang Lim, Sungjoo Yoo

ArXiv.org

초록

대규모 언어 모델(LLM)은 높은 연산 비용으로 인해 배치 시 어려움에 직면해 있으며, 사후 학습 양자화(Post-Training Quantization, PTQ)가 한 가지 해결책이지만, 기존 회전 기반 방법은 2비트와 같은 매우 낮은 비트폭에서는 어려움을 겪는다. 본 연구에서는 기존 방법의 한계를 해결하는 향상된 회전 행렬을 구성하기 위한, 학습이 필요 없는(free) 새로운 접근법을 제안한다. 핵심 기여는 순서(sequency) 배열을 활용한 월시-하다마드 변환(Walsh-Hadamard transform)으로, 유사한 주파수 성분을 군집화하여 표준 하다마드 행렬에 비해 양자화 오차를 줄이고 성능을 크게 향상시킨다는 점이다. 또한, 더 작은 월시 블록을 갖는 블록 대각(block-diagonal) 행렬을 사용하는 Grouped Sequency-arranged Rotation(GSR)을 제안하여, 이상치(outlier)의 영향을 효과적으로 격리함으로써 학습 기반 최적화 방법과 견줄 만한 성능을 달성하면서도 어떤 학습도 요구하지 않는다. 본 방법은 추론 과제와 WikiText-2에서의 Perplexity(PPL) 점수에서 견고한 성능을 보인다. 또한, 본 방법은 기존에 학습된 회전 기법들 위에 적용하더라도 결과를 개선한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Quantization (signal processing)Hadamard transformRotation (mathematics)OutlierPerplexityTransformation (genetics)Lossless compressionMultiplier (economics)

타입

preprint

IF / 인용수

- / 0

원문

http://arxiv.org/abs/2505.03810

게재 연도

2025

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)