주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
article
|
인용수 8
·
2024RE-RAG: Improving Open-Domain QA Performance and Interpretability with Relevance Estimator in Retrieval-Augmented Generation
Kiseung Kim, Jay-Yoon Lee
검색 증강 생성(Retrieval Augmented Generation, RAG) 프레임워크는 매개변수 지식과 외부 지식을 결합하여 오픈 도메인 질의응답(opendomain question answering) 과제에서 최첨단 성능을 보이는 방식을 활용한다. 그러나 RAG 프레임워크는 질의에 무관련 컨텍스트가 함께 제공될 때 성능 저하가 발생한다. 본 연구에서는 기존 리랭커(reranker)들이 제공하던 컨텍스트 간 상대적 관련성뿐 아니라, 주어진 컨텍스트가 해당 질문에 답하는 데 유용한지 분류하는 데 활용할 수 있는 신뢰도(confidence)를 제공하는 관련성 추정기(relevance estimator, RE)를 도입한 RE-RAG 프레임워크를 제안한다. 우리는 정답 컨텍스트에 대한 레이블 없이도 질의-답변(question-answer) 데이터만을 단순히 활용하여 RE를 훈련하기 위한 약지도(weakly supervised) 방법을 제안한다. 소형 생성기(small language model; sLM)로 학습된 RE는 RE와 함께 미세조정된 sLM의 성능을 향상시킬 뿐만 아니라, 이전에 참조되지 않았던 대규모 언어 모델(LLMs)의 성능도 향상시킬 수 있음을 보인다. 또한 우리는 RE가 측정한 신뢰도를 활용하는 새로운 디코딩 전략을 조사한다. 예를 들어, 검색된 컨텍스트를 바탕으로 해당 질문에 답하는 것이 "불가능(unanswerable)"하다고 사용자에게 알리도록 선택하거나, 무관련 컨텍스트에 의존하기보다는 LLM의 매개변수 지식에 의존하도록 선택하는 방법 등이 있다.
https://doi.org/10.18653/v1/2024.emnlp-main.1236
Interpretability
Computer science
Relevance (law)
Domain (mathematical analysis)
Estimator
Information retrieval
Relevance feedback
Artificial intelligence
Natural language processing
Mathematics
2
article
|
인용수 3
·
2024Comparing Neighbors Together Makes it Easy: Jointly Comparing Multiple Candidates for Efficient and Effective Retrieval
Jonghyun Song, Cheyon Jin, Wenlong Zhao, Andrew McCallum, Jay-Yoon Lee
일반적인 검색-재랭킹 패러다임은 빠른 바이인코더(BE)로 방대한 집합에서 관련 후보를 검색한 뒤, 비용이 크지만 정확한 크로스인코더(CE)를 제한된 후보 집합에 적용하는 방식으로 이루어진다. 그러나 이와 같은 작은 부분 집합에 의존할 경우 바이인코더로부터의 오류 전파에 취약해지며, 이는 전체 성능을 제한한다. 이러한 문제를 해결하기 위해 우리는 Comparing Multiple Candidates(CMC) 프레임워크를 제안한다. CMC는 쿼리와 유사한 후보의 다중 임베딩(즉, 이웃)을 얕은 self-attention 계층을 통해 비교하여, 서로 간에 맥락화된 풍부한 표현을 제공한다. 또한 CMC는 다수의 비교를 동시에 처리할 수 있을 만큼 확장 가능하다. 예를 들어 CMC로 10K 후보를 비교하는 데 걸리는 시간은 CE로 16개 후보를 비교하는 것과 유사하다. ZeSHEL 데이터셋에서의 실험 결과, BE와 CE 사이에 CMC를 매끄러운 중간 재랭커(BE-CMC-CE)로 삽입하면, 단지 바이인코더만 사용하는 경우(BE-CE)에 비해 recall@k가 효과적으로 향상됨을 보이며(R@16에서 +6.7%-p, R@64에서 +3.5%-p), 지연은 미미한 수준(<7%)이다. 또한 상위 1단 정확도를 개선하는 최종 단계 재랭커로서의 CMC의 효과를 검증하기 위해, 엔티티, 패시지, 대화 랭킹과 같은 다운스트림 태스크에서 실험을 수행한다. 그 결과, CMC는 단지 더 빠를 뿐만 아니라(11배) 종종 크로스인코더보다 더 효과적이며, 예측 정확도 향상으로 이어짐을 확인했다. 구체적으로 위키피디아 엔티티 링크에서는 +0.7%-p, DSTC7 대화 랭킹에서는 +3.3%-p의 개선이 나타났다.
https://doi.org/10.18653/v1/2024.emnlp-main.1242
Computer science
Information retrieval
3
preprint
|
인용수 0
·
2024Locate&Edit: Energy-based Text Editing for Efficient, Flexible, and Faithful Controlled Text Generation
Hye Ryung Son, Jay-Yoon Lee
arXiv (Cornell University)
최근의 제어된 텍스트 생성(CTG) 접근법은 대개 디코딩 시점에서 기본 언어 모델(LM)의 가중치 또는 로짓(logits)을 조작하는 방법을 포함한다. 그러나 이러한 방법들은 최신의 블랙박스 LMs에는 적용할 수 없으며, 기본 LM이 원래 생성한 결과의 핵심 의미를 보존하는 데에도 비효율적이다. 본 연구에서는 블랙박스가 아닌 텍스트 생성 접근인 CTG를 위한 효율적이고 유연한 에너지 기반 접근법인 Locate&Edit(L&E)를 제안한다. 이는 시판(off-the-shelf) 에너지 모델을 사용하여 기본 LM의 텍스트 출력을 편집한다. 기본 LM으로부터 텍스트 출력이 주어지면, L&E는 먼저 에너지 모델을 활용해 제약(예: 독성)과 가장 관련 있는 구간(span)을 위치(Locate)시키고, 이어서 이러한 구간을 더 적절한 대안으로 대체하여 편집(Edit)한다. 중요하게도, 본 방법은 텍스트 출력만 필요하므로 블랙박스 LMs와 호환 가능하다. 또한 L&E는 구성 요소 모델에 대해 특정 아키텍처를 요구하지 않으므로, 다양한 조합의 이용 가능한 시판 에너지 모델과 함께 동작할 수 있다. 더 나아가 L&E는 제약과 관련된 양상만을 선택적으로 수정하고 나머지는 변경하지 않음으로써, 기본 LM의 원래 생성 결과를 보존한다. 이러한 표적 편집은 또한 L&E가 효율적으로 동작하도록 보장한다. 우리의 실험 결과는 L&E가 기본 LM 생성 결과의 의미 보존과 속도에서 우수함을 달성하는 한편, 제약 충족에서도 경쟁력 있거나 향상된 성능을 동시에 얻음을 확인하였다. 뿐만 아니라, 에너지 분포의 과립성(granularity)이 CTG 성능에 미치는 영향을 분석한 결과, 기존의 이진 분류기 기반 에너지 모델에 비해 미세한(granular) 회귀(regression) 기반 에너지 모델이 제약 충족을 향상시키는 것으로 나타났다.
http://arxiv.org/abs/2407.00740
Text generation
Computer science
Natural language processing
Information retrieval
4
preprint
|
인용수 1
·
2024Case-Based Reasoning Approach for Solving Financial Question Answering
Yi Kyung Kim, Jay-Yoon Lee
arXiv (Cornell University)
기계가 인간 언어를 이해하는 정도를 측정하는 일은 종종 그 추론 능력, 즉 질문에 대한 답을 도출하기 위한 논리적 과정의 평가를 포함한다. 최근의 언어 모델들은 텍스트 기반 과제에서 놀라운 성능을 보여주었으나, 텍스트, 표, 수치와 같은 이질적인 정보를 포함하는 복잡한 추론 문제에서의 효율성은 여전히 불확실하다. 이러한 공백을 메우기 위해 FinQA는 금융 문서를 위한 수치 추론 데이터셋을 도입하는 동시에 프로그램 생성(program generation) 접근법을 제안하였다. 본 연구는 오류의 절반(48%)이 생성되는 연산의 부정확성에서 비롯됨을 확인하였다. 이 문제를 해결하기 위해, 우리는 인공지능 패러다임인 사례 기반 추론(case based reasoning, CBR)을 활용하여 수치 추론 문제를 다루는 새로운 접근법을 제안한다. CBR은 유사한 사례(즉, 유사한 질문과 그에 대응하는 논리 프로그램)를 제공함으로써 문제 해결에 대한 지침을 제공한다. 우리의 모델은 주어진 질문에 대해 관련 사례를 검색한 뒤, 검색된 사례와 문맥 정보를 바탕으로 답을 생성한다. FinQA 데이터셋에 대한 실험을 통해 본 접근법의 경쟁력 있는 성능을 입증하였으며, 또한 사례 저장소를 확장함으로써 FinQA가 취약점을 보였던 복잡한 다단계 프로그램의 해결을 돕는다는 점을 추가로 보여주었다.
http://arxiv.org/abs/2405.13044
Question answering
Computer science
Artificial intelligence
5
preprint
|
인용수 1
·
2024RE-RAG: Improving Open-Domain QA Performance and Interpretability with Relevance Estimator in Retrieval-Augmented Generation
Kiseung Kim, Jay-Yoon Lee
arXiv (Cornell University)
검색 증강 생성(Retrieval Augmented Generation, RAG) 프레임워크는 매개변수 지식(parametric knowledge)과 외부 지식을 결합하여 개방형 도메인 질의응답(open-domain question answering) 과제에서 최신 수준의 성능을 보이는 것을 입증한다. 그러나 RAG 프레임워크는 질의가 비관련 문맥과 함께 제공될 때 성능이 저하되는 문제를 겪는다. 본 연구에서는 기존의 재순위화기(rerankers)가 제공하던 문맥 간 상대적 관련성뿐만 아니라, 주어진 문맥이 주어진 질문에 대한 답변에 유용한지를 분류하는 데 활용할 수 있는 신뢰도(confidence)까지 함께 제공하는 관련성 추정기(relevance estimator, RE)를 도입한 RE-RAG 프레임워크를 제안한다. 우리는 정답 문맥에 대한 어떠한 라벨도 없이 질의-답변 데이터만을 사용하여 RE를 학습하기 위한 약지도 학습(weakly supervised) 방법을 제안한다. 또한 소형 생성기(small generator, sLM)로 학습한 RE는 RE와 함께 미세조정된 sLM의 성능을 향상시킬 뿐만 아니라, 이전에 참조되지 않았던 대형 언어 모델(large language models, LLMs)의 성능도 향상시킬 수 있음을 보인다. 더 나아가, 검색된 문맥을 바탕으로 질문에 답할 수 없음을 사용자에게 알리도록 선택하는 것, 또는 비관련 문맥 대신 LLM의 매개변수 지식(parametric knowledge)에 의존하도록 선택하는 것과 같이, RE가 측정한 신뢰도를 활용하는 새로운 디코딩 전략을 탐구한다.
http://arxiv.org/abs/2406.05794
Interpretability
Relevance (law)
Estimator
Computer science
Domain (mathematical analysis)
Information retrieval
Artificial intelligence
Mathematics
Statistics
Political science