기본 정보
연구 분야
프로젝트
논문
구성원
읽는 시간 · 52초

국어사 말뭉치 구축과 형태소분석 기반 용례 추출 연구

Korean Language History Corpus Construction and Morphological Analysis for Usage Example Extraction

연구 내용

형태소분석 프로그램을 통해 국어 역사 자료를 분석하고, 시대별 용례를 체계적으로 추출·정리하는 연구

국어 변화를 연구하기 위해서는 시대별 자료의 표준화와 검색 가능 형태의 구축이 필요합니다. 본 연구는 국어 역사 자료를 대상으로 형태소분석을 수행하는 분석 프로그램을 개발하고, 이를 기반으로 형태소분석말뭉치를 구축합니다. 또한 시대별 어휘 용례를 정리해 용례집과 DB로 활용 가능한 형태로 제공하는 데 차별성이 있습니다. 중세 국어에서 특정 시기(17-19세기) 및 현대어 자료와의 연계를 염두에 두고 말뭉치 설계를 진행합니다.

관련 연구 성과

관련 논문

0

관련 특허

0

관련 프로젝트

1

연구 흐름

초기에는 국어 역사 자료를 형태소 수준에서 일관되게 처리하기 위한 분석 프로그램과 말뭉치 구축 절차를 확립하는 데 집중했습니다. 이후 원시말뭉치를 기반으로 형태소분석말뭉치를 생성하고, 시대별 어휘 용례를 추출하는 파이프라인을 구성했습니다. 현재는 21세기 세종계획 말뭉치 등 연계 말뭉치 요소를 고려하여 시대별 비교가 가능한 데이터 구조로 고도화하고, 이를 바탕으로 시대별 용례집 발간으로 이어지도록 정리 작업을 수행합니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

  • 형태소분석 말뭉치 표준화
  • 시대별 어휘 용례 추출
  • 국어사 DB 구축
  • 중세 국어 자동 분석 도구
  • 어휘 변화 경향 분석
  • 역사 자료 기반 교육용 콘텐츠
  • 디지털 국어사 검색 인터페이스
  • 문헌 비교 연구용 데이터
  • 세종계획 말뭉치 연계 분석
  • 연구 재현 가능한 데이터 파이프라인

관련 프로젝트

구분

제목

1

국어 역사 자료 통합 형태소 분석 프로그램 개발을 통한 형태소분석말뭉치 구축과 시대별 어휘 용례집 발간

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.