잡음 환경에서 음성기반 모델의 표현 통계를 정규화하고 시간관계를 증류하며, 노이즈 추출과 음성개선을 병렬 학습해 인식과 인증을 안정화하는 연구
MOS 예측으로 생성 음성의 품질을 직접 최적화하고, 화자 임베딩 및 prosody·emotion 정보를 조건으로 원샷 합성과 음성변환을 수행하는 연구
통화 음성·텍스트 신호를 기반으로 보이스피싱을 탐지하고, 딥페이크 및 악성앱 정황과 함께 단말 내 인공지능으로 예측 정확도를 높이는 연구