실세계 언어 응용에서 분포 외(out-of-distribution, OOD) 샘플을 탐지하는 것은 사용자에게 경고를 하거나 그러한 신뢰도 낮은 샘플을 거부하는 데 도움이 된다. 그러나 현대의 과도하게 매개변수화된 언어 모델은 분포 내(in-distribution, ID) 샘플과 OOD 샘플 모두에 대해 과도하게 확신하는 예측을 생성하는 경우가 많다. 특히 언어 모델은 ID 샘플과 유사한 의미적 표현을 갖는 OOD 샘플에 취약한데, 이는 이러한 OOD 샘플이 ID 매니폴드 근처에 위치하기 때문이다. 거절(rejection) 네트워크는 ID 및 다양한 이상치(outlier) 샘플로 학습시켜 테스트 시 OOD 샘플을 탐지할 수 있지만, 보조 OOD 데이터셋을 명시적으로 수집하는 작업은 데이터 수집에 추가적인 부담을 준다. 본 논문에서는 ID 클래스와 관련된 토큰을 순차적으로 마스킹하여 대리(surrogate) OOD 데이터셋을 구성하는 간단하지만 효과적인 방법인 Pseudo Outlier Exposure(POE)를 제안한다. POE가 도입하는 대리 OOD 샘플은 ID 데이터와 유사한 표현을 보이며, 이는 거절 네트워크 학습에 가장 효과적이다. 우리의 방법은 어떠한 외부 OOD 데이터도 필요로 하지 않으며, 시판(기성품) Transformers 내에서 손쉽게 구현할 수 있다. 최첨단 알고리즘들과의 포괄적인 비교를 통해, POE가 여러 텍스트 분류 벤치마크에서 경쟁력 있음을 보여준다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.