옥정슬 교수 연구실
기본 정보
연구 분야
프로젝트
논문
구성원
preprint|
인용수 0
·2025
Efficient Latent Semantic Clustering for Scaling Test-Time Computation of LLMs
Sung Jae Lee, Hoyoung Kim, Jeongyeon Hwang, Eunhyeok Park, Jungseul Ok
ArXiv.org
초록

단일 입력에 대해 여러 개 또는 순차적인 출력을 생성하고 분석하는 테스트 시점 연산(Scaling test-time computation)은 불확실성 정량화 및 다단계 추론의 발전을 통해 입증된 바와 같이 대규모 언어 모델(LLM)의 신뢰성과 품질을 향상시키는 유망한 전략으로 자리 잡았다. 핵심적으로 공유되는 구성 요소는 의미 군집화(semantic clustering)로, 형식은 다르지만 동일한 의미를 전달하는 출력들을 묶는다. 의미 군집화는 출력 의미(semantics)에 대한 분포를 추정할 수 있게 하며, 추론 경로를 반복적으로 탐색하는 것을 방지하는 데 도움이 된다. 그러나 기존 접근법은 대체로 외부 모델에 의존하여 상당한 계산 오버헤드를 유발하며, 맥락을 인지하는 의미를 포착하는 데에도 종종 실패한다. 본 연구는 생성기 LLM의 내부 은닉 상태(hidden states)를 군집화에 활용함으로써 외부 모델의 필요성을 제거하는, 경량이면서도 맥락에 민감한 방법인 잠재 의미 군집화(Latent Semantic Clustering, LSC)를 제안한다. 다양한 LLM과 데이터셋에 걸친 광범위한 실험 결과, LSC는 기존 방법의 성능을 유지하거나 능가하면서 테스트 시점 연산 확장의 계산 효율을 유의미하게 향상시킴을 확인하였다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Cluster analysisSemantics (computer science)Key (lock)Component (thermodynamics)ComputationOverhead (engineering)Generator (circuit theory)
타입
preprint
IF / 인용수
- / 0
게재 연도
2025

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.