Retrieval-Augmented Response Generation for Knowledge-Grounded Conversation in the Wild | 박재휘 교수 연구실 | 서울시립대학교 통계학과

|박재휘 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

Article|

인용수 33

·2022

Retrieval-Augmented Response Generation for Knowledge-Grounded Conversation in the Wild

Yeonchan Ahn, Sang‐goo Lee, Junho Shim, Jaehui Park

IF 3.9 (2022) IEEE Access

초록

인터넷 사용자들은 흥미로운 사실이나 주제에 관한 대화를 나누면서 웹으로부터 다양한 지식을 함께 접하는 경우가 흔하다. 그러나 기존의 대부분 지식 기반 대화 모델은 대화의 주제와 관련하여 오직 단일 문서만을 고려한다. 최근 제안된 검색 증강(retrieval-augmented) 모델들은 다수의 문서에 기반하여 응답을 생성하지만, 주어진 주제를 무시하고 대화의 국소적 문맥(local context)만을 사용한다. 이를 위해 본 연구는 주제와 대화의 국소적 문맥 모두와 관련 있는 적절한 범위의 문서를 검색하여 이를 지식 기반 응답 생성에 활용하는 새로운 검색 증강 응답 생성 모델을 제안한다. 우리의 모델은 먼저 전체 대화에서 추출한 주제 단어(topic words)와 응답 이전의 토큰(tokens)을 모두 입력으로 받아 여러 표상(representations)을 산출한다. 그 다음 대화와 문서 인코더에서 각각 처음 N 토큰의 표상과 대화의 키워드 및 문서에서의 키워드 표상을 선택하고, 대화의 표상 그룹을 문서의 표상 그룹과 각각 비교한다. 학습을 위해서는 정답 지식(ground truth knowledge) 없이도 모델이 지식 기반 응답을 생성하도록 유도하는 새로운 데이터 가중치(data-weighting) 방식을 도입한다. 대규모 데이터셋을 사용한 자동 및 사람 평가 결과는, 제안한 모델이 기존 최신(state-of-the-art) 모델에 비해 보다 더 지식이 풍부하고 다양하며 관련성 높은 응답을 생성할 수 있음을 보여준다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

ConversationComputer scienceContext (archaeology)Security tokenInformation retrievalRepresentation (politics)Natural language processingArtificial intelligenceThe InternetWorld Wide Web

타입

Article

IF / 인용수

3.9 / 33

원문

https://doi.org/10.1109/access.2022.3228964

게재 연도

2022