RE-RAG: Improving Open-Domain QA Performance and Interpretability with Relevance Estimator in Retrieval-Augmented Generation | 이재윤 교수 연구실 | 서울대학교 데이터사이언스학과

이재윤 교수 연구실

홈

기본 정보

연구 분야

프로젝트

논문

구성원

preprint|

인용수 1

·2024

RE-RAG: Improving Open-Domain QA Performance and Interpretability with Relevance Estimator in Retrieval-Augmented Generation

Kiseung Kim, Jay-Yoon Lee

arXiv (Cornell University)

초록

검색 증강 생성(Retrieval Augmented Generation, RAG) 프레임워크는 매개변수 지식(parametric knowledge)과 외부 지식을 결합하여 개방형 도메인 질의응답(open-domain question answering) 과제에서 최신 수준의 성능을 보이는 것을 입증한다. 그러나 RAG 프레임워크는 질의가 비관련 문맥과 함께 제공될 때 성능이 저하되는 문제를 겪는다. 본 연구에서는 기존의 재순위화기(rerankers)가 제공하던 문맥 간 상대적 관련성뿐만 아니라, 주어진 문맥이 주어진 질문에 대한 답변에 유용한지를 분류하는 데 활용할 수 있는 신뢰도(confidence)까지 함께 제공하는 관련성 추정기(relevance estimator, RE)를 도입한 RE-RAG 프레임워크를 제안한다. 우리는 정답 문맥에 대한 어떠한 라벨도 없이 질의-답변 데이터만을 사용하여 RE를 학습하기 위한 약지도 학습(weakly supervised) 방법을 제안한다. 또한 소형 생성기(small generator, sLM)로 학습한 RE는 RE와 함께 미세조정된 sLM의 성능을 향상시킬 뿐만 아니라, 이전에 참조되지 않았던 대형 언어 모델(large language models, LLMs)의 성능도 향상시킬 수 있음을 보인다. 더 나아가, 검색된 문맥을 바탕으로 질문에 답할 수 없음을 사용자에게 알리도록 선택하는 것, 또는 비관련 문맥 대신 LLM의 매개변수 지식(parametric knowledge)에 의존하도록 선택하는 것과 같이, RE가 측정한 신뢰도를 활용하는 새로운 디코딩 전략을 탐구한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

InterpretabilityRelevance (law)EstimatorComputer scienceDomain (mathematical analysis)Information retrievalArtificial intelligenceMathematicsStatisticsPolitical science

타입

preprint

IF / 인용수

- / 1

원문

http://arxiv.org/abs/2406.05794

게재 연도

2024

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)