RnDcircle

XVoice: 멀티모달 음성 메타학습

2023과학기술정보통신부사람중심인공지능핵심원천기술개발

프로젝트 소개

본 과제는 멀티모달 생체신호와 음성을 함께 활용하여, 말이 어려운 사람도 생체신호만으로 음성을 인식·합성할 수 있는 SSI(Silent speech interface) 기술을 개발하는 연구임. 연구 목표는 생체신호에 최적화된 메타 학습 기술과 개인화된 음성 합성 기술 확보에 있음. 핵심 내용은 Metric 방식 메타학습, 한국어·영어 멀티모달 데이터베이스 구축, 음성장애 측정기기 프로토타입, Outlier 대응 정규화 함수, 자기지도 학습 기반 음성 메타학습, 다차원 텐서 기반 특징 선택, 텍스트 수도 레이블 생성 및 few-shot 메타학습 개발임. 기대 효과는 음성장애인 의사소통 지원, 잡음·레이블 부족 환경 대응, 의료·산업용 저비용 고효율 메타모델 확산 가능성 제시임.

멀티모달메타학습생체신호인공지능침묵형 음성인터페이스AIBiosignalMeta LearningMulti ModalSilent Speech Interface

참여형태

주관

사업명

사람중심인공지능핵심원천기술개발

부처명

과학기술정보통신부

주관기관명

인하대학

공동/위탁수행기관명

서울대학, 한국과학기술원

과제 수행연도

2023

과제 수행기간

2022.04.01 ~ 2026.12.31

과제 고유번호

1711193481

연구 개발단계

응용연구

연구비

총연구비

1,000,000,000 원

정부지원연구개발비

1,000,000,000 원

위탁연구비

0 원

민간연구비

0 원

주관/협동기관 정보

주관/협동	수행기관명	연구수행주체	지역
주관	인하대학	대학	인천광역시

공동/위탁기관 정보2건

공동/위탁	수행기관명	연구수행주체	참여형태	공동연구비 수입금액 (원)	공동연구비 지출금액 (원)
공동	서울대학	대학	기타	-	378,000,000
공동	한국과학기술원	대학	기타	-	150,000,000

과제 기반 국내외 특허0건

출원/등록 기관	발명의 명칭	출원일자	출원국가	출원번호	등록일자	등록번호

과제 기반 SCI(E) 논문0건

논문명	학술지명	DOI/URL