지식 그래프 생성 시스템 및 그 생성 방법
KNOWLEDGE GRAPH CREATING SYSTEM AND CREATING METHOD FOR THE SAME
특허 요약
본 발명의 지식 그래프 생성 시스템은, 학습용 데이터셋을 기반으로 사전 학습된 학습모델에 자연어 텍스트 문서를 입력하여 복수의 엔티티들을 추출하는 엔티티 추출부; 관계 온톨로지를 기반으로 상기 복수의 엔티티들 사이의 관계를 추출하는 관계 추출부; 상기 복수의 엔티티들 사이의 관계가 두 개 이상인 경우 관계를 재배정하는 관계 배정부; 및 상기 복수의 엔티티들 및 상기 복수의 엔티티들 사이의 관계에 기초하여 지식 그래프를 생성하는 그래프 생성부;를 포함할 수 있다.
청구항
번호청구항
1

학습용 데이터셋을 기반으로 사전 학습된 학습모델에 자연어 텍스트 문서를 입력하여 복수의 엔티티들을 추출하는 엔티티 추출부;관계 온톨로지를 기반으로 상기 복수의 엔티티들 사이의 관계를 추출하는 관계 추출부;상기 복수의 엔티티들 사이의 관계가 두 개 이상인 경우 관계를 재배정하는 관계 배정부; 및상기 복수의 엔티티들 및 상기 복수의 엔티티들 사이의 관계에 기초하여 지식 그래프를 생성하는 그래프 생성부;를 포함하는,지식 그래프 생성 시스템.

2

청구항 1에 있어서,상기 지식 그래프는,상기 복수의 엔티티들 각각에 대응하는 노드 및 상기 복수의 엔티티들 사이의 관계에 대응하는 간선을 포함하는,지식 그래프 생성 시스템.

3

청구항 2에 있어서,상기 학습용 데이터셋은,범용 언어 모델 데이터셋을 박물관 데이터셋으로 파인튜닝하는,지식 그래프 생성 시스템.

4

청구항 3에 있어서,상기 엔티티 추출부는,상기 자연어 텍스트 내에서 엔티티들 및 각 엔티티들에 대해 엔티티 타입을 추출하는 개체명 인식(NER) 모델인,지식 그래프 생성 시스템.

5

청구항 4에 있어서,상기 관계 추출부는,한국 문화 및 역사 정보 관련 데이터와 특정 유물 관련 사실 및 문맥 데이터를 병합한 관계 온톨로지 중 특정 엔티티 속성에 대한 관계를 추출하여 관계 온톨로지를 구축하는,지식 그래프 생성 시스템.

6

청구항 5에 있어서,상기 관계 배정부는,두 개의 엔티티 쌍들에 두 개 이상의 관계가 배정될 경우, 상기 엔티티들 주변의 문맥을 문맥 매핑 테이블에 대응하여 상기 관계를 재배정하는,지식 그래프 생성 시스템.

7

학습용 데이터셋을 구축하여 학습모델을 학습하는 단계;사전 학습된 상기 학습모델에 문서를 입력하여 엔티티들을 도출하는 단계;관계 온톨로지로 상기 엔티티들 사이의 관계를 배정하는 단계; 및상기 엔티티들 및 상기 관계에 기초하여 지식 그래프를 생성하는 단계;를 포함하는,지식 그래프 생성 방법.

8

청구항 7에 있어서,상기 학습하는 단계는,대규모 데이터를 갖는 Frame Dataset에 특정 분야 지식을 포함한 Core Dataset을 병합하여 파인튜닝하여 학습용 데이터셋을 구축하는,지식 그래프 생성 방법.

9

청구항 8에 있어서,상기 엔티티들을 도출하는 단계 이전에, 자연어 텍스트 문서를 복수의 문장 단위로 분리하는 단계를 더 포함하며,상기 엔티티들을 도출하는 단계는, 도출된 상기 엔티티들에 엔티티 타입을 레이블링하는,지식 그래프 생성 방법.

10

청구항 9에 있어서,상기 관계를 배정하는 단계는,엔티티 쌍 및 이들의 관계로 트리플 형태를 구성하되,하나의 엔티티 쌍에 대해 2개 이상의 관계가 배정될 시, 상기 엔티티들 주변의 문맥을 문맥 매핑 테이블에 대응하여 엔티티 쌍에 대해 관계를 재배정하는 단계를 더 포함하는,지식 그래프 생성 방법.