조선대학교 컴퓨터공학과 전찬준 교수
AMCL(Advanced Multimedia Computing Lab)은 음성 및 오디오 신호처리, 딥러닝, 인공지능 분야에서 세계적인 연구를 선도하는 연구실입니다. 본 연구실은 음향 이벤트 위치추정 및 탐지, 음색 변환, 화자 인식, 음성 합성 등 다양한 오디오 인공지능 기술을 개발하고 있으며, 실제 산업 및 사회적 문제 해결에 기여하고 있습니다. 특히, 음향 이벤트 위치추정 및 탐지 분야에서는 다채널 마이크로폰 어레이와 딥러닝 기반 신호처리 기법을 결합하여, 복잡한 환경에서도 높은 정확도의 위치추정과 이벤트 탐지가 가능한 시스템을 개발하고 있습니다. 이러한 기술은 비상벨 감지, 재난 대응, 스마트 시티 소음 관리 등 다양한 응용 분야에서 활용되고 있습니다. Zero-shot 음색 변환 및 음성 합성 분야에서는 병렬 데이터의 한계를 극복하기 위해 비병렬 데이터, 오토인코더, 정보 교란, diffusion 모델 등 최신 기법을 적용하고 있습니다. 이를 통해 학습 데이터에 없는 새로운 화자나 음색에 대해서도 자연스러운 음성 변환과 합성이 가능하며, 발성 장애인을 위한 음성 보조기, 개인화 음성 서비스, 미디어 콘텐츠 제작 등 다양한 산업에 혁신을 제공하고 있습니다. 화자 인식 분야에서는 대조학습 기반의 딥러닝 모델을 활용하여, 기존 방식보다 더욱 강건하고 일반화된 화자 임베딩을 학습하고 있습니다. 하드 네거티브 샘플링, InfoNCE, CLIP 기반 학습 프레임워크 등을 적용하여 실제 환경에서의 오인 문제를 효과적으로 해결하고 있으며, zero-shot classification 등 최신 연구 동향을 반영하여 새로운 화자에 대한 인식 성능도 크게 향상시키고 있습니다. AMCL은 다양한 정부 및 산업체 연구과제, 특허, 국내외 학술지 논문, 국제학회 발표 등 활발한 연구 활동을 통해 국내외 인공지능 오디오 신호처리 분야의 발전을 이끌고 있습니다. 앞으로도 실생활에 밀접한 문제 해결과 혁신적인 기술 개발을 통해, 인공지능 기반의 오디오 신호처리 분야에서 세계적인 경쟁력을 갖춘 연구실로 성장할 것입니다.
대표 연구 분야 확인하기