Semantic Exploration with Adaptive Gating for Efficient Problem Solving with Language Models | 옥정슬 교수 연구실 | 포항공과대학교 인공지능대학원

옥정슬 교수 연구실

홈

기본 정보

연구 분야

프로젝트

논문

구성원

preprint|

인용수 0

·2025

Semantic Exploration with Adaptive Gating for Efficient Problem Solving with Language Models

Sungjae Lee, Hyejin Park, Jae-Chang Kim, Jungseul Ok

arXiv (Cornell University)

초록

최근 대규모 언어 모델(LLM)은 트리 탐색과 같은 다단계 추론 방법을 활용하여 다양한 추론 경로를 탐색해야 하는 여러 복잡한 과제에서 주목할 만한 잠재력을 보여주고 있다. 그러나 기존 방법은 대체로 계산적 비효율성과 중복의 문제를 겪는다. 첫째, 과제의 난이도 다양성을 간과하여 쉬운 과제에서도 불필요하게 과도한 탐색을 수행한다. 둘째, 추론 경로의 의미론을 무시하여 의미적으로 동일한 경로를 중복해서 탐색하게 된다. 이러한 한계를 해결하기 위해, 우리는 계산 효율적인 방법인 의미론적 탐색과 적응적 게이팅(Semantic Exploration with Adaptive Gating, SEAG)을 제안한다. SEAG는 앞선 단순 추론 방법의 답변에 대한 신뢰 수준에 기반하여 트리 탐색을 수행할지 여부를 동적으로 결정하는 적응적 게이팅 메커니즘을 사용한다. 또한 트리 기반 탐색은 의미론적으로 동일한 추론 단계를 통합함으로써 중복 탐색을 줄이면서도 정확도를 유지하거나 오히려 향상시킨다. 광범위한 실험 결과, SEAG는 GSM8K 및 ARC를 포함한 복잡 추론 벤치마크에서 Llama2, Llama3, Mistral과 같은 다양한 언어 모델을 사용했을 때, 기존 트리 탐색 기반 방법 대비 계산 비용의 31%만으로도 평균 4.3%의 정확도 향상을 유의미하게 달성함을 보여준다. 우리의 코드는 https://github.com/ml-postech/SEAG-semantic-exploration-with-adaptive-gating 에서 제공된다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Computer scienceGatingArtificial intelligenceNatural language processingPsychologyNeuroscience

타입

preprint

IF / 인용수

- / 0

원문

http://arxiv.org/abs/2501.05752

게재 연도

2025

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)