한양대학교 융합전자공학부 장준혁 교수
장준혁 연구실은 음성 신호처리와 인공지능 기술의 융합을 통해 차세대 음성 인식, 음성 합성, 음성 품질 향상, 음향 환경 인지 등 다양한 연구를 선도적으로 수행하고 있습니다. 본 연구실은 딥러닝, 강화학습, 자기지도학습 등 최신 인공지능 기법을 음성 및 음향 신호처리에 적극적으로 적용하여, 실제 환경에서의 강인한 성능과 실시간 처리가 가능한 혁신적인 알고리즘을 개발하고 있습니다. 음성 인식 분야에서는 트랜스포머, 컨볼루션 신경망, 순환 신경망 등 다양한 딥러닝 구조를 활용하여 한국어, 영어 등 다국어 음성 인식 시스템을 구축하고 있습니다. 또한, 데이터 부족 문제를 해결하기 위한 반지도학습, 자기지도학습, 연속 학습 프레임워크를 도입하여, 소량의 레이블 데이터만으로도 높은 인식 성능을 달성하고 있습니다. 화자 적응, 개인화 음성 인식, 멀티모달 음성 인식 등 사용자의 특성과 다양한 입력 신호를 반영한 맞춤형 음성 인식 기술도 활발히 연구 중입니다. 음성 합성 및 음성 품질 향상 분야에서는 비자동회귀 방식, 적대적 학습, 확산 모델 등 최신 생성형 AI 기법을 적용하여 자연스러운 음질과 빠른 합성 속도를 동시에 달성하는 연구를 진행하고 있습니다. 또한, 패킷 손실 은닉, 잡음 및 에코 제거, 잔향 제거, 대역폭 확장 등 다양한 음성 품질 저하 요인을 극복하기 위한 딥러닝 기반 알고리즘을 개발하고 있습니다. 실제 통신 환경과 모바일, 임베디드 환경에서의 실시간 적용을 위한 경량화 모델, 하드웨어 최적화 연구도 병행하고 있습니다. 음향 신호 기반 환경 인지 및 음향 사건 분류 분야에서는 컨볼루션 신경망, 트랜스포머, 데이터 증강, 마스킹, 멀티모달 융합 등 다양한 기법을 적용하여 도시 및 실내외 환경에서 발생하는 복잡한 음향 신호를 분석하고, 환경의 종류나 특정 사건을 자동으로 분류 및 검출하는 기술을 개발하고 있습니다. 데이터 부족 문제를 해결하기 위한 혁신적인 데이터 증강 기법과 멀티모달 융합 기술을 통해 모델의 일반화 성능을 크게 향상시키고 있습니다. 이외에도 본 연구실은 음성 및 음향 신호처리 기술을 기반으로 한 차량 진단, 비접촉식 생체 신호 분석, 감정 인식, 스마트 시티, 자율주행, IoT, 헬스케어 등 다양한 응용 분야로 연구를 확장하고 있습니다. 국내외 특허 출원, 국제 학회 논문 발표, 산학협력 프로젝트, 대회 수상 등 다양한 연구 성과를 통해 학문적, 산업적 기여를 지속적으로 이어가고 있습니다.
대표 연구 분야 확인하기