이재윤 교수 연구실
기본 정보
연구 분야
프로젝트
논문
구성원
article|
인용수 3
·2024
Comparing Neighbors Together Makes it Easy: Jointly Comparing Multiple Candidates for Efficient and Effective Retrieval
Jonghyun Song, Cheyon Jin, Wenlong Zhao, Andrew McCallum, Jay-Yoon Lee
초록

일반적인 검색-재랭킹 패러다임은 빠른 바이인코더(BE)로 방대한 집합에서 관련 후보를 검색한 뒤, 비용이 크지만 정확한 크로스인코더(CE)를 제한된 후보 집합에 적용하는 방식으로 이루어진다. 그러나 이와 같은 작은 부분 집합에 의존할 경우 바이인코더로부터의 오류 전파에 취약해지며, 이는 전체 성능을 제한한다. 이러한 문제를 해결하기 위해 우리는 Comparing Multiple Candidates(CMC) 프레임워크를 제안한다. CMC는 쿼리와 유사한 후보의 다중 임베딩(즉, 이웃)을 얕은 self-attention 계층을 통해 비교하여, 서로 간에 맥락화된 풍부한 표현을 제공한다. 또한 CMC는 다수의 비교를 동시에 처리할 수 있을 만큼 확장 가능하다. 예를 들어 CMC로 10K 후보를 비교하는 데 걸리는 시간은 CE로 16개 후보를 비교하는 것과 유사하다. ZeSHEL 데이터셋에서의 실험 결과, BE와 CE 사이에 CMC를 매끄러운 중간 재랭커(BE-CMC-CE)로 삽입하면, 단지 바이인코더만 사용하는 경우(BE-CE)에 비해 recall@k가 효과적으로 향상됨을 보이며(R@16에서 +6.7%-p, R@64에서 +3.5%-p), 지연은 미미한 수준(<7%)이다. 또한 상위 1단 정확도를 개선하는 최종 단계 재랭커로서의 CMC의 효과를 검증하기 위해, 엔티티, 패시지, 대화 랭킹과 같은 다운스트림 태스크에서 실험을 수행한다. 그 결과, CMC는 단지 더 빠를 뿐만 아니라(11배) 종종 크로스인코더보다 더 효과적이며, 예측 정확도 향상으로 이어짐을 확인했다. 구체적으로 위키피디아 엔티티 링크에서는 +0.7%-p, DSTC7 대화 랭킹에서는 +3.3%-p의 개선이 나타났다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Computer scienceInformation retrieval
타입
article
IF / 인용수
- / 3
게재 연도
2024

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.