과업 지향 대화 시스템의 주된 목표는 인간 대화의 의도와 요구를 파악하는 것이다. 기존의 많은 연구는 서면 대화(written dialogue) 설정에서 수행되지만, 실제 환경의 음성 대화(spoken dialogues)를 처리하는 데에는 항상 어려움이 존재한다. 이를 위해 DSTC10 챌린지 주최 측은 음성 대화에 기반한 견고한 대화 상태 추적(dialgue state tracking, DST) 모델을 구축하는 과제를 제안한다. 본 논문은 강력한 기존 DST 모델(즉, MinTL)을 바탕으로 대화 상태 추적기를 구축하기 위한 핵심 구성 요소를 제시한다. 1) 데이터 증강은 평가 데이터셋에 존재하는 개체를 포착하는 모델의 능력을 효과적으로 향상시킨다. 2) 레벤슈타인 후처리(Levenshtein post-processing)는 자동 음성 인식 오류로 인해 발생하는 모델 예측의 왜곡을 방지하는 것을 목표로 한다. 본 방법의 효과를 검증하기 위해 DSTC10 데이터셋에서 모델을 평가하고, 모델의 각 구성 요소를 제거(ablating)하여 질적 분석을 수행한다. 실험 결과, 본 모델은 모든 평가 지표에서 기준선(baseline) 대비 유의하게 더 높은 성능을 보였으며, 챌린지에서 3위를 차지했다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.