RnDcircle

전이학습을 활용한 범용 한국어 자연어 처리 딥러닝 모델 연구

2023과학기술정보통신부개인기초연구(과기정통부)

프로젝트 소개

본 과제는 한국어 자연어 처리에서 언어 모델, 개체명 인식, 기계 독해, 요약 등 여러 문제를 하나의 전이학습 기반 딥러닝 모델로 해결하려는 연구임. 연구 목표는 한국어 자연어 처리용 범용 모델을 구축하고, 학습 자원이 부족한 한계를 전이학습으로 보완하는 데 있음. 연구 내용은 대용량 텍스트로 한국어 선수학습 언어 모델을 만들고, 이를 개체명 인식, 기계 독해, 요약 등 다운스트림 태스크에 파인-튜닝하는 방식임. 1차년도 토크나이제이션과 마스킹 전략 연구, 2차년도 저자원 파인-튜닝 및 아키텍처 확장, 3차년도 모델 고도화와 TPU 학습으로 구성됨. 기대 효과는 한국어 인코더-디코더 기반 선수학습 모델 공개, 자연어 처리 성능 향상, 저자원 한국어 연구 활성화와 후속 연구 확산 가능성 확보임.

자연어 처리전이학습선수학습언어모델한국어 처리인공지능딥러닝Natural Language ProcessingTransfer LearningPre-trainingLanguage ModelKorean NLPArtificial IntelligenceDeep Learning

참여형태

주관

사업명

개인기초연구(과기정통부)

부처명

과학기술정보통신부

주관기관명

인천대학

과제 수행연도

2023

과제 수행기간

2021.03.01 ~ 2024.02.29

과제 고유번호

1711182517

연구 개발단계

기초연구

연구비

총연구비

31,476,000 원

정부지원연구개발비

31,476,000 원

위탁연구비

0 원

민간연구비

0 원

주관/협동기관 정보

주관/협동	수행기관명	연구수행주체	지역
주관	인천대학	대학	인천광역시

과제 기반 국내외 특허0건

출원/등록 기관	발명의 명칭	출원일자	출원국가	출원번호	등록일자	등록번호

과제 기반 SCI(E) 논문0건

논문명	학술지명	DOI/URL