한국과학기술원 전기및전자공학부 김회린 교수
김회린 연구실은 음성 신호에서 발화 내용과 화자 특성을 추출하는 딥러닝 기반 인식 기술을 중심으로 연구합니다. 잡음 환경에서는 HuBERT 계열 음성기반 모델에 분산·불변성·공분산 정규화를 적용하고, 노이즈 추출 네트워크와 음성개선 네트워크를 병렬 학습하여 견고한 자동음성인식과 화자인증을 수행합니다. 또한 MOS 예측을 활용한 TTS 품질 최적화, RawNet3 화자 인코더 기반 원샷 다화자 합성과 prosody·emotion 조건 음성변환 모델을 개발합니다. 이 기술을 통화 음성·텍스트 분석 기반 보이스피싱 탐지·수사 지원 문제에 적용합니다.
온디바이스 합성음성 탐지 시스템 및 방법
자기지도 학습을 활용한 왜곡에 강인한 합성 음성 탐지 장치 및 그의 동작 방법
문장에 대한 띄어읽기 처리를 수행하는 음성 합성 장치 및 그 동작 방법