Signal Processing Lab
전자공학과 최승호
신호처리 연구실은 음성, 오디오, 음향 신호처리 분야에서 국내외적으로 선도적인 연구를 수행하고 있습니다. 본 연구실은 잡음 및 잔향 제거, 음향 에코 제거, VR 음향, 오디오 렌더링, 음성 명료도 추정 및 개선 등 다양한 주제를 중심으로, 실생활에서의 음성 및 오디오 품질 향상에 기여하고 있습니다. 특히, 최신 딥러닝 기반 신호처리 기법을 적극적으로 도입하여, 기존의 한계를 극복하고 차세대 신호처리 기술을 개발하고 있습니다.
또한, 음성 및 오디오 코딩 분야에서도 협대역, 광대역, 초광대역 음성 코딩 및 오디오 코딩 기술을 연구하고 있습니다. 저비트율 환경에서도 고품질의 음성 및 오디오를 제공할 수 있는 효율적인 코딩 알고리즘 개발에 주력하며, 실시간 통신 환경에서의 패킷 손실이나 오류에 강인한 복원 기술도 함께 연구하고 있습니다. 이러한 연구는 모바일 통신, 인터넷 전화, 방송, 스트리밍 서비스 등 다양한 응용 분야에서 활용되고 있습니다.
음성인식 및 화자인식 분야에서는 딥러닝 기반의 알고리즘을 통해 다양한 환경에서의 인식 정확도와 신뢰성을 높이고 있습니다. 잡음 환경이나 다양한 발화 조건에서도 높은 인식률을 유지할 수 있도록, 비침입적 음성 명료도 추정, 음성 구간 검출, 화자 분할 등 다양한 전처리 및 후처리 기술을 개발하고 있습니다. 이로써 스마트 디바이스, 자동차, 로봇 등 다양한 분야에서의 음성 기반 인터페이스 구현에 기여하고 있습니다.
통신신호처리 및 디지털신호처리 응용 분야에서는 가시광통신, 적응적 신호처리, 영상, 바이오, 레이더 신호처리 등 다양한 기술을 개발하고 있습니다. 변화하는 통신 환경에 적응할 수 있는 신호처리 기술과, 실제 하드웨어 및 임베디드 시스템에 적용 가능한 소프트웨어 구현 기술을 함께 연구하여, 차세대 통신 및 융합 서비스의 기반을 마련하고 있습니다.
신호처리 연구실은 다양한 산학협력 및 정부과제 수행을 통해 실용적이고 혁신적인 연구 성과를 창출하고 있습니다. 앞으로도 음성, 오디오, 음향 신호처리 및 관련 융합 분야에서 세계적인 연구실로 도약하기 위해 지속적으로 노력할 것입니다.
Noise Reduction
Speech Intelligibility Estimation
360VR Audio Systems
음성/오디오/음향 신호처리
음성, 오디오, 그리고 음향 신호처리는 신호처리 연구실의 핵심 연구 분야 중 하나입니다. 본 연구실에서는 잡음 및 잔향 제거, 음향 에코 제거, VR 음향, 오디오 렌더링, 그리고 음성 명료도 추정 및 개선 등 다양한 주제를 다루고 있습니다. 이러한 연구는 실생활에서의 음성 통신 품질 향상, 가상현실 및 증강현실 환경에서의 몰입감 있는 오디오 경험 제공, 그리고 스마트 디바이스의 음성 인식 성능 개선에 중요한 역할을 합니다.
특히, 잡음 및 잔향 제거 기술은 다양한 환경에서 발생하는 불필요한 소음과 반향을 효과적으로 제거하여, 사용자가 더욱 명확하게 음성을 인식할 수 있도록 돕습니다. 음향 에코 제거는 원격 회의나 통화 등에서 발생하는 에코 현상을 최소화하여, 쾌적한 커뮤니케이션 환경을 제공합니다. VR 음향 및 오디오 렌더링 기술은 3차원 공간에서의 음향 효과를 정밀하게 구현함으로써, 사용자가 실제 공간에 있는 듯한 몰입감을 느낄 수 있도록 지원합니다.
음성 명료도 추정 및 개선 연구는 청각 장애인, 고령자, 또는 소음이 많은 환경에서의 음성 전달 효율성을 높이는 데 큰 기여를 하고 있습니다. 본 연구실은 최신 딥러닝 기반 신호처리 기법을 적극적으로 도입하여, 기존의 한계를 극복하고 차세대 음성/오디오/음향 신호처리 기술을 선도하고 있습니다.
음성 및 오디오 코딩
음성 및 오디오 코딩 분야는 신호처리 연구실의 또 다른 주요 연구 영역입니다. ADPCM, G.729, G.729a, G.718 등 다양한 표준 코덱을 기반으로 협대역, 광대역, 초광대역 음성 코딩 및 오디오 코딩 기술을 개발하고 있습니다. 이러한 코딩 기술은 통신망에서의 효율적인 데이터 전송과 저장, 그리고 고품질 음성/오디오 서비스 제공에 필수적입니다.
특히, 저비트율 환경에서도 음성 및 오디오의 품질을 최대한 보존할 수 있는 코딩 알고리즘 개발에 중점을 두고 있습니다. 이를 위해 신호의 특성을 정밀하게 분석하고, 효율적인 압축 및 복원 기법을 적용합니다. 또한, 실시간 통신 환경에서 발생할 수 있는 패킷 손실이나 오류에 강인한 코딩 및 복원 기술도 함께 연구하고 있습니다.
본 연구실은 국제 표준화 활동에도 적극적으로 참여하며, 차세대 음성 및 오디오 코딩 기술의 발전을 선도하고 있습니다. 이러한 연구는 모바일 통신, 인터넷 전화(VoIP), 방송, 스트리밍 서비스 등 다양한 응용 분야에서 활용되고 있으며, 미래의 미디어 환경 변화에 능동적으로 대응할 수 있는 기반 기술을 제공합니다.
음성인식 및 화자인식
음성인식과 화자인식은 인공지능 및 신호처리 기술의 융합을 통해 인간과 기계 간의 자연스러운 상호작용을 실현하는 핵심 분야입니다. 신호처리 연구실에서는 딥러닝 기반의 음성인식 및 화자인식 알고리즘을 개발하여, 다양한 환경에서의 인식 정확도와 신뢰성을 높이고 있습니다.
특히, 잡음이 많은 환경이나 다양한 발화 조건에서도 높은 인식률을 유지할 수 있도록, 비침입적 음성 명료도 추정, 음성 구간 검출, 화자 분할(speaker diarization) 등 다양한 전처리 및 후처리 기술을 연구하고 있습니다. 또한, 모바일 및 IoT 환경에서의 실시간 음성인식, 다중 화자 인식, 그리고 개인화된 음성인식 시스템 개발에도 주력하고 있습니다.
이러한 연구는 스마트폰, 스마트 스피커, 자동차, 로봇 등 다양한 스마트 디바이스에서의 음성 기반 인터페이스 구현에 직접적으로 기여하고 있습니다. 더 나아가, 보안 및 인증, 사용자 맞춤형 서비스 제공 등 다양한 분야로의 확장 가능성도 높아, 미래 지능형 시스템의 핵심 기술로 자리매김하고 있습니다.
1
Deep Learning-Based Estimation of Reverberant Environment for Audio Data Augmentation
Yun Deokgyu, Choi Seung Ho
SENSORS, 2022
2
A Non-Intrusive Speech Intelligibility Estimation Method Based on Deep Learning Using Autoencoder Features
Kim, Y (Kim, Yoonhee), Yun, D (Yun, Deokgyu), Lee, H (Lee, Hannah), Choi, SH (Choi, Seung Ho), 0, 0, 0, 0
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, 2020
3
A Deep Learning-Based Approach to Non-Intrusive Objective Speech Intelligibility Estimation
Yun, D (Yun, Deokgyu), Lee, H (Lee, Hannah), Choi, SH (Choi, Seung Ho)
IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS, 2018
1
2017년 ~ 2021년, VR관련 창조씨앗과제 (음향신호처리), 미래창조과학부
2
2015년 ~ 2020년, 신호정보 특화연구센터 과제 (보코더), 국방과학연구소(ADD)
3
2016년 ~ 2019년, IoT관련 대학ICT연구센터 과제 (적응적 신호처리), 미래창조과학부