전이학습을 활용한 범용 한국어 자연어 처리 딥러닝 모델 연구

2022과학기술정보통신부개인기초연구(과기정통부)
프로젝트 소개
본 과제는 한국어 자연어 처리의 여러 문제를 하나의 전이학습 기반 딥러닝 모델로 풀기 위한 연구임. 언어 모델, 개체명 인식, 기계 독해, 요약 등에서 공통으로 쓰일 범용 모델과, 학습용 언어 자원이 부족한 한국어의 한계를 보완할 방법을 찾는 데 목적이 있음. 연구 내용은 대용량 텍스트 기반 선수학습, 토크나이제이션과 마스킹 전략 연구, 적은 지도 학습 데이터를 활용한 파인-튜닝, 태스크별 아키텍처 확장, 선수학습-파인-튜닝 고도화로 구성됨. 기대 효과는 인코더-디코더 기반 한국어 선수학습 모델 공개, 자연어 생성·이해·태깅 성능 향상, 저자원 한국어 NLP 활성화와 후속 연구 확장 가능성 확보임.
자연어 처리전이학습선수학습언어모델한국어 처리인공지능딥러닝Natural Language ProcessingTransfer LearningPre-trainingLanguage ModelKorean NLPArtificial IntelligenceDeep Learning
참여형태
주관
사업명
개인기초연구(과기정통부)
부처명
과학기술정보통신부
주관기관명
인천대학
과제 수행연도
2022
과제 수행기간
2021.03.01 ~ 2024.02.29
과제 고유번호
1711161975
연구 개발단계
기초연구
연구비
총연구비
31,476,000
정부지원연구개발비
31,476,000
위탁연구비
0
민간연구비
0
주관/협동기관 정보
주관/협동수행기관명연구수행주체지역
주관인천대학대학인천광역시
과제 기반 국내외 특허0건
출원/등록 기관발명의 명칭출원일자출원국가출원번호등록일자등록번호
과제 기반 SCI(E) 논문0건
논문명학술지명DOI/URL