주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
article
|
인용수 1
·
2025Towards Robust and Efficient Federated Low-Rank Adaptation with Heterogeneous Clients
Jabin Koo, Minwoo Jang, Jungseul Ok
대규모 언어 모델(LLMs)에 대한 연합 미세조정(federated fine-tuning)은 큰 모델 업데이트를 전송하는 데 따른 막대한 통신 오버헤드로 인해 중대한 어려움에 직면한다. Low Rank Adaptation(LoRA)이 해결책으로 제안되었음에도 불구하고, 연합 학습에서의 적용은 집계(aggregation) 과정에서의 불일치(discordance)로 인해 복잡해진다. 기존의 불일치 문제를 다루는 방법들은 종종 이질적인 데이터 설정에서 저랭크(low ranks)에 대한 성능 저하를 겪는다. 이에 대응하여 우리는 교대 동결(Alternating freeze)과 적응적 랭크 선택(Adaptive rank selection)을 이용한 저랭크 적응(LoRA)인 LoRA-A 2(교대 동결 및 적응적 랭크 선택을 포함한 저랭크 적응)를 제안하며, 이는 저랭크 및 높은 데이터 이질성이 존재하는 어려운 환경에서 견고함을 보인다. 실험 결과에 따르면, LoRA-A 2는 극단적인 이질성과 저랭크 조건에서도 성능을 유지하여, 성능 저하 없이 완전 미세조정(full fine-tuning)과 비교했을 때 업로드되는 파라미터를 최대 유의미한 수준까지 감소시킨다. 이러한 적응 메커니즘은 연합 미세조정에서의 견고성과 통신 효율을 향상시키며, 자원이 제한된 환경에서 LLM을 실제로 배치할 수 있게 한다.
https://doi.org/10.18653/v1/2025.acl-long.19
Adaptation (eye)
Computer science
Rank (graph theory)
Distributed computing
Data science
Mathematics
Psychology
2
article
|
인용수 5
·
2025Retrieval-Augmented Generation with Estimation of Source Reliability
Jeongyeon Hwang, Junyoung Park, Hyejin Park, Dong‐Woo Kim, Sangdon Park, Jungseul Ok
검색 증강 생성(Retrieval-Augmented Generation, RAG)은 외부 데이터베이스에서 정보를 검색하여 대규모 언어 모델(LLM)의 제한된 내부 지식을 보완함으로써, 사실적 정확도를 향상하는 데 효과적인 접근법이다. 그러나 표준 RAG은 질의와 문서 간의 관련성에만 의존하여 정보를 검색하는 경우가 많아, 이러한 자료원의 이질적인 신뢰도를 간과함으로써 부정확한 정보를 검색할 위험이 있다.
이 문제를 해결하기 위해 본 연구에서는 자료원 신뢰도 인지 RAG(Reliability-Aware RAG, RA-RAG)라는 새로운 다중 자료원 RAG 프레임워크를 제안한다. RA-RAG는 자료원의 신뢰도를 추정하고 이를 활용하여 높은 신뢰도이면서도 관련성이 높은 문서를 우선적으로 선택함으로써, 보다 견고하고 정확한 응답 생성이 가능하도록 설계되었다. 구체적으로 RA-RAG는 먼저 여러 자료원에 걸쳐 정보를 교차 대조하여 자료원의 신뢰도를 추정한다. 그 다음 신뢰도와 관련성 기준 상위 자료원에서 문서를 검색하고, 가중 다수결(weighted majority voting, WMV)로 이들의 정보를 집계한다. 이때 선택적 검색은 성능을 저하시키지 않으면서도 확장성을 보장한다.
종합적인 실험 결과, RA-RAG는 이질적인 자료원 신뢰도가 존재하는 시나리오에서 기존 기준 방법들을 일관되게 능가하며, 자료원 수가 증가함에 따라 효율적으로 확장됨을 보였다. 또한 RA-RAG가 실제 환경의 자료원에 대해 신뢰도를 추정할 수 있음을 시연함으로써, 실용적 적용 가능성을 강조한다.
https://doi.org/10.18653/v1/2025.emnlp-main.1738
Reliability (semiconductor)
Estimation
Component (thermodynamics)
Measure (data warehouse)
Estimation theory
3
article
|
인용수 2
·
2025Semantic Exploration with Adaptive Gating for Efficient Problem Solving with Language Models
Sungjae Lee, Hyejin Park, Jae-Chang Kim, Jungseul Ok
대규모 언어 모델(LLM)의 최근 발전은, 트리 탐색(tree search)과 같은 다단계 추론 방법을 통해 다양한 추론 경로를 탐색해야 하는 여러 복잡한 과제에서 주목할 만한 잠재력을 보여주었다. 그러나 기존 방법들은 대개 계산 효율성의 비효율성과 중복 탐색 문제를 겪는다. 첫째, 과제 난이도의 다양성을 간과하여 쉬운 과제에 대해서도 불필요하게 지나치게 광범위한 탐색을 수행하는 경우가 많다. 둘째, 추론 경로의 의미(semantic)를 무시함으로써 의미적으로 동일한 경로에 대한 중복 탐색이 발생한다. 이러한 한계를 해결하기 위해, 우리는 계산적으로 효율적인 방법인 의미 기반 탐색과 적응적 게이팅(Semantic Exploration with Adaptive Gating, SEAG)을 제안한다. SEAG는 선행의 간단한 추론 방법으로부터 얻어진 답변의 신뢰도(confidence level)에 따라 트리 탐색을 수행할지 여부를 동적으로 결정하는 적응적 게이팅 메커니즘을 사용한다. 또한, 트리 기반 탐색은 의미적으로 동일한 추론 단계를 통합하여, 중복 탐색을 줄이면서도 정확도는 유지하거나 오히려 향상시킨다. 광범위한 실험 결과, SEAG는 GSM8K와 ARC를 포함한 복잡한 추론 벤치마크에서, Llama2, Llama3, Mistral과 같은 다양한 언어 모델을 대상으로 기존 트리 탐색 기반 방법과 비교했을 때 평균적으로 정확도를 4.3% 유의하게 개선하면서도 계산 비용은 31%만을 요구함을 보여주었다. 코드는 https://github.com/ml-postech/SEAGsemantic-exploration-with-adaptive-gating 에서 제공된다.
https://doi.org/10.18653/v1/2025.acl-long.29
Computer science
Gating
Artificial intelligence
Natural language processing
Theoretical computer science
Psychology
4
preprint
|
인용수 0
·
2025Semantic Exploration with Adaptive Gating for Efficient Problem Solving with Language Models
Sungjae Lee, Hyejin Park, Jae-Chang Kim, Jungseul Ok
arXiv (Cornell University)
최근 대규모 언어 모델(LLM)은 트리 탐색과 같은 다단계 추론 방법을 활용하여 다양한 추론 경로를 탐색해야 하는 여러 복잡한 과제에서 주목할 만한 잠재력을 보여주고 있다. 그러나 기존 방법은 대체로 계산적 비효율성과 중복의 문제를 겪는다. 첫째, 과제의 난이도 다양성을 간과하여 쉬운 과제에서도 불필요하게 과도한 탐색을 수행한다. 둘째, 추론 경로의 의미론을 무시하여 의미적으로 동일한 경로를 중복해서 탐색하게 된다. 이러한 한계를 해결하기 위해, 우리는 계산 효율적인 방법인 의미론적 탐색과 적응적 게이팅(Semantic Exploration with Adaptive Gating, SEAG)을 제안한다. SEAG는 앞선 단순 추론 방법의 답변에 대한 신뢰 수준에 기반하여 트리 탐색을 수행할지 여부를 동적으로 결정하는 적응적 게이팅 메커니즘을 사용한다. 또한 트리 기반 탐색은 의미론적으로 동일한 추론 단계를 통합함으로써 중복 탐색을 줄이면서도 정확도를 유지하거나 오히려 향상시킨다. 광범위한 실험 결과, SEAG는 GSM8K 및 ARC를 포함한 복잡 추론 벤치마크에서 Llama2, Llama3, Mistral과 같은 다양한 언어 모델을 사용했을 때, 기존 트리 탐색 기반 방법 대비 계산 비용의 31%만으로도 평균 4.3%의 정확도 향상을 유의미하게 달성함을 보여준다. 우리의 코드는 https://github.com/ml-postech/SEAG-semantic-exploration-with-adaptive-gating 에서 제공된다.
http://arxiv.org/abs/2501.05752
Computer science
Gating
Artificial intelligence
Natural language processing
Psychology
Neuroscience
5
article
|
인용수 1
·
2025Bridging the Gap between Expert and Language Models: Concept-guided Chess Commentary Generation and Evaluation
Jae-Chang Kim, Jinmin Goh, Inseok Hwang, Jaewoong Cho, Jungseul Ok
Jaechang Kim, Jinmin Goh, Inseok Hwang, Jaewoong Cho, Jungseul Ok. 국제연맹(Association for Computational Linguistics) 북미 국가 회의(2025) 인문 언어 기술(제1권: 장편 논문) 회의록. 2025.
https://doi.org/10.18653/v1/2025.naacl-long.481
Bridging (networking)
Computer science
Natural language processing
Artificial intelligence