서강대학교 컴퓨터공학 김지환 교수
Auditory Intelligence Laboratory(청각지능연구실)는 음성 및 오디오 신호 처리, 인공지능 기반 음성인식, 음성합성, 오디오 이벤트 검출 등 다양한 음성처리 기술을 선도적으로 연구하는 연구실입니다. 본 연구실은 End-to-End 방식의 음성인식 시스템, WFST 기반 언어모델 결합, 스트리밍 및 온라인 음성인식, 다화자 환경에서의 화자 분리 및 식별, 그리고 저자원 환경에서도 높은 성능을 보장하는 음성인식 기술 등 다양한 첨단 연구를 수행하고 있습니다. 특히, 설명가능한 인공지능(XAI) 기술을 활용하여 디지털 헬스케어 분야, 예를 들어 뇌졸중 후 마비말장애 환자의 음성 분석 및 진단, 말장애 오류 유형 분석 등 의료와 융합된 인공지능 연구에 집중하고 있습니다. 이를 통해 의료진과 환자 모두에게 신뢰할 수 있는 진단 도구를 제공하며, 사회적 약자 지원에 실질적으로 기여하고 있습니다. 또한, 대규모 언어모델(LLM)과 음성인식의 융합을 통해 외국인 한국어 학습자의 발화 평가, 자동 채점, 발음 오류 분석 등 한국어 교육 분야의 디지털 혁신을 이끌고 있습니다. 다양한 다국적 발화 코퍼스 구축, 데이터 증강, 자동화된 평가 시스템 개발 등을 통해 글로벌 언어교육 시장에서 경쟁력을 확보하고 있습니다. 음성합성(Text-to-Speech) 및 오디오 이벤트 검출 분야에서도 최신 신경망 기반 기술을 적용하여, 자연스러운 음성 생성, 멀티미디어 콘텐츠의 자동 등급 분류, 유해성 이벤트 검출 등 실용적이고 사회적 파급력이 큰 연구를 수행하고 있습니다. 이러한 기술은 스마트홈, IoT, 미디어, 보안 등 다양한 산업 분야에 적용되고 있습니다. Auditory Intelligence Laboratory는 산학협력, 정부과제, 국제공동연구 등 다양한 프로젝트를 통해 실용적이고 혁신적인 음성처리 기술을 개발하고 있으며, 앞으로도 인공지능과 음성기술의 융합을 선도하는 연구실로서 사회와 산업에 지속적으로 기여할 것입니다.
대표 연구 분야 확인하기