본 논문에서는 SSML(speech synthesis markup language)을 지원하는 음성 합성 시스템에서 합성 결과의 품질을 향상시키기 위해 한국어 문장 기호 전처리기를 제안한다. 한국어 위키피디아 문서를 분석한 후, 문장 기호의 의미에 대해 8가지 범주를 제안하고, 각 범주를 분류하기 위한 11개의 정규표현식 규칙을 제시한다. 한국어 문장 기호 전처리 시스템을 개발한 결과, 63,000개의 문장에 대해 정확도 56%와 재현율 71.45%를 달성하였다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.