RnDcircle

전이학습을 활용한 범용 한국어 자연어 처리 딥러닝 모델 연구

2022과학기술정보통신부개인기초연구(과기정통부)

프로젝트 소개

본 과제는 한국어 자연어 처리의 여러 문제를 하나의 전이학습 기반 딥러닝 모델로 풀기 위한 연구임. 언어 모델, 개체명 인식, 기계 독해, 요약 등에서 공통으로 쓰일 범용 모델과, 학습용 언어 자원이 부족한 한국어의 한계를 보완할 방법을 찾는 데 목적이 있음. 연구 내용은 대용량 텍스트 기반 선수학습, 토크나이제이션과 마스킹 전략 연구, 적은 지도 학습 데이터를 활용한 파인-튜닝, 태스크별 아키텍처 확장, 선수학습-파인-튜닝 고도화로 구성됨. 기대 효과는 인코더-디코더 기반 한국어 선수학습 모델 공개, 자연어 생성·이해·태깅 성능 향상, 저자원 한국어 NLP 활성화와 후속 연구 확장 가능성 확보임.

자연어 처리전이학습선수학습언어모델한국어 처리인공지능딥러닝Natural Language ProcessingTransfer LearningPre-trainingLanguage ModelKorean NLPArtificial IntelligenceDeep Learning

참여형태

주관

사업명

개인기초연구(과기정통부)

부처명

과학기술정보통신부

주관기관명

인천대학

과제 수행연도

2022

과제 수행기간

2021.03.01 ~ 2024.02.29

과제 고유번호

1711161975

연구 개발단계

기초연구

연구비

총연구비

31,476,000 원

정부지원연구개발비

31,476,000 원

위탁연구비

0 원

민간연구비

0 원

주관/협동기관 정보

주관/협동	수행기관명	연구수행주체	지역
주관	인천대학	대학	인천광역시

과제 기반 국내외 특허0건

출원/등록 기관	발명의 명칭	출원일자	출원국가	출원번호	등록일자	등록번호

과제 기반 SCI(E) 논문0건

논문명	학술지명	DOI/URL