기본 정보
연구 분야
프로젝트
논문
구성원
article|
인용수 2
·2023
Adaptive Multi-Domain Dialogue State Tracking on Spoken Conversations
Jungwoo Lim, Taesun Whang, Dongyub Lee, Heuiseok Lim
IF 4.1IEEE/ACM Transactions on Audio Speech and Language Processing
초록

과업 지향 대화 시스템의 주된 목표는 인간 대화의 의도와 요구를 파악하는 것이다. 기존의 많은 연구는 서면 대화(written dialogue) 설정에서 수행되지만, 실제 환경의 음성 대화(spoken dialogues)를 처리하는 데에는 항상 어려움이 존재한다. 이를 위해 DSTC10 챌린지 주최 측은 음성 대화에 기반한 견고한 대화 상태 추적(dialgue state tracking, DST) 모델을 구축하는 과제를 제안한다. 본 논문은 강력한 기존 DST 모델(즉, MinTL)을 바탕으로 대화 상태 추적기를 구축하기 위한 핵심 구성 요소를 제시한다. 1) 데이터 증강은 평가 데이터셋에 존재하는 개체를 포착하는 모델의 능력을 효과적으로 향상시킨다. 2) 레벤슈타인 후처리(Levenshtein post-processing)는 자동 음성 인식 오류로 인해 발생하는 모델 예측의 왜곡을 방지하는 것을 목표로 한다. 본 방법의 효과를 검증하기 위해 DSTC10 데이터셋에서 모델을 평가하고, 모델의 각 구성 요소를 제거(ablating)하여 질적 분석을 수행한다. 실험 결과, 본 모델은 모든 평가 지표에서 기준선(baseline) 대비 유의하게 더 높은 성능을 보였으며, 챌린지에서 3위를 차지했다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Levenshtein distanceComputer scienceTask (project management)Artificial intelligenceNatural language processingSpoken languageComponent (thermodynamics)Domain (mathematical analysis)Speech recognitionMachine learning
타입
article
IF / 인용수
4.1 / 2
게재 연도
2023

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.