본 논문은 저자원 언어를 위한 음성 처리에서 교차언어 음성 표현이 언어적 유사성에 의해 어떻게 영향을 받는지, 그리고 효과적인 출발(소스) 언어 선택을 강조하여 고찰한다. 선행 교차언어 연구는 다양한 출발 언어를 활용해 대상 저자원 언어의 성능을 향상시켜 왔으나, 선택에 대한 철저한 고려 없이 수행되었다. 본 연구는 여러 언어 계통 간 음성적 근접성을 평가하기 위한 실용적 접근을 바탕으로, 언어 선택에 관한 심층 분석을 제공한다는 점에서 차별성을 가진다. 우리는 다언어 훈련에서 계통 내 유사성이 성능에 미치는 영향을 조사하여 언어 역동성을 이해하는 데 도움을 주고자 한다. 또한 계통과 무관하게 음운적으로 유사한 언어를 사용하는 효과를 평가한다. 음소 인식 과제에서 음운적으로 유사한 언어를 활용하면 단일언어 훈련 대비 상대적 성능이 일관되게 55.6% 향상되며, 이는 대규모 자기지도 학습 모델의 성능을 상회하기까지 한다. 동일한 언어 계통 내에서의 다언어 훈련은 더 높은 음운적 유사성이 성능을 향상시키는 반면, 낮은 유사성은 단일언어 훈련에 비해 성능을 저하시킨다는 것을 보여준다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.