XVoice: 멀티모달 음성 메타학습

2023과학기술정보통신부사람중심인공지능핵심원천기술개발
프로젝트 소개
본 과제는 멀티모달 생체신호와 음성을 함께 활용하여, 말이 어려운 사람도 생체신호만으로 음성을 인식·합성할 수 있는 SSI(Silent speech interface) 기술을 개발하는 연구임. 연구 목표는 생체신호에 최적화된 메타 학습 기술과 개인화된 음성 합성 기술 확보에 있음. 핵심 내용은 Metric 방식 메타학습, 한국어·영어 멀티모달 데이터베이스 구축, 음성장애 측정기기 프로토타입, Outlier 대응 정규화 함수, 자기지도 학습 기반 음성 메타학습, 다차원 텐서 기반 특징 선택, 텍스트 수도 레이블 생성 및 few-shot 메타학습 개발임. 기대 효과는 음성장애인 의사소통 지원, 잡음·레이블 부족 환경 대응, 의료·산업용 저비용 고효율 메타모델 확산 가능성 제시임.
멀티모달메타학습생체신호인공지능침묵형 음성인터페이스AIBiosignalMeta LearningMulti ModalSilent Speech Interface
참여형태
주관
사업명
사람중심인공지능핵심원천기술개발
부처명
과학기술정보통신부
주관기관명
인하대학
공동/위탁수행기관명
서울대학, 한국과학기술원
과제 수행연도
2023
과제 수행기간
2022.04.01 ~ 2026.12.31
과제 고유번호
1711193481
연구 개발단계
응용연구
연구비
총연구비
1,000,000,000
정부지원연구개발비
1,000,000,000
위탁연구비
0
민간연구비
0
주관/협동기관 정보
주관/협동수행기관명연구수행주체지역
주관인하대학대학인천광역시
공동/위탁기관 정보2건
공동/위탁수행기관명연구수행주체참여형태공동연구비 수입금액 (원)공동연구비 지출금액 (원)
공동서울대학대학기타-378,000,000
공동한국과학기술원대학기타-150,000,000
과제 기반 국내외 특허0건
출원/등록 기관발명의 명칭출원일자출원국가출원번호등록일자등록번호
과제 기반 SCI(E) 논문0건
논문명학술지명DOI/URL