자연어 처리(Natural Language Processing, NLP)에서 모호성은 인간 언어의 내재적 복잡성과 유연성으로 인해 여전히 근본적인 과제로 남아 있다. 대규모 언어 모델(Large Language Models, LLMs)의 등장과 함께, 이들이 확장된 역량과 응용을 바탕으로 모호성 해결의 중요성은 더욱 커졌다. 본 논문은 대화형 질의응답(Conversational Question Answering, CQA) 맥락에서 언어 기반 시스템, 특히 LLMs의 맥락에서 모호성의 정의, 형태, 그리고 함의를 탐구한다. 우리는 핵심 용어와 개념을 정의하고, LLMs가 가능하게 하는 다양한 명확화(disambiguation) 접근법을 분류하며, 각각의 장점과 단점을 비교 분석한다. 또한 모호성 탐지 및 해결 기법을 벤치마킹하기 위해 공개적으로 이용 가능한 데이터셋을 살펴보고, 그것들이 진행 중인 연구와 갖는 관련성을 강조한다. 마지막으로 특히 에이전트적(agentic) 환경에서의 열린 문제와 향후 연구 방향을 식별하고, 추가 탐구가 필요한 영역을 제안한다. LLMs와 관련된 모호성과 명확화에 관한 현재 연구를 포괄적으로 검토함으로써, 보다 견고하고 신뢰할 수 있는 LLM 기반 시스템의 개발에 기여하고자 한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.