서울대학교 전기·정보공학부 김남수 교수
김남수 연구실은 전기·정보공학부 소속으로, 음성 신호 처리, 음성 합성, 음성 인식, 화자 인식, 음성 향상 등 음성 및 오디오 인공지능 분야에서 국내외적으로 선도적인 연구를 수행하고 있습니다. 본 연구실은 딥러닝, 통계적 신호 처리, 자기지도학습 등 최신 AI 기술을 적극적으로 도입하여, 실세계에서 활용 가능한 혁신적인 음성 처리 기술을 개발하고 있습니다. 특히, 다화자 및 다스타일 음성 합성, 저자원 환경에서의 음성 합성, 제로샷 음성 합성, 멀티링구얼 음성 합성 등 다양한 음성 합성 기술을 연구하고 있습니다. 또한, 음성 인식 분야에서는 잡음 및 반향 환경에서도 높은 인식률을 보장하는 강인한 음성 인식 시스템, 음성 데이터의 전처리 및 후처리, 그리고 실시간 음성 인식 및 경량화 모델 개발에 주력하고 있습니다. 음성 향상 분야에서는 비음수 행렬 인수분해(NMF), 딥러닝 기반 음성 향상, 멀티채널 신호 처리, 자기지도학습 기반 음성 향상 등 다양한 기술을 개발하고 있습니다. 더불어, 화자 인식 및 음성 기반 인증 분야에서는 딥러닝 기반 임베딩, 화자 정보 분리, 신뢰성 있는 인증 시스템, 스푸핑 방지 등 첨단 기술을 연구하고 있습니다. 이러한 연구 성과는 스마트 디바이스, 원격 회의, 로봇, 자동차, 보안, 헬스케어 등 다양한 산업 분야에 적용되고 있으며, 실제 서비스로의 확장 가능성도 매우 높습니다. 김남수 연구실은 앞으로도 음성 및 오디오 인공지능 분야에서 세계적인 연구 성과를 창출하고, 인간과 기계 간의 자연스러운 소통을 실현하는 데 기여할 것입니다.
대표 연구 분야 확인하기