유전자와 화합물과 질병의 관련문헌 추출시스템
A relevant document extraction system for gene chemical disease
특허 요약
본 발명에 따른 유전자와 화합물과 질병의 관련문헌 추출시스템에는, 사용자 쿼리가 자연어로 입력되는 입력부; 입력된 자연어를 개체로 인식하는 개체명 인식부; 상기 개체명 인식부에서 인식된 개체를 이용하여, 유전자와 화합물과 질병과 관련되는 문헌을 제공하는 인공지능 학습모델; 상기 인공지능학습모델에서 추출된 문헌을 후처리하는 후처리부; 및 상기 후처리부에서 처리되어 걸러진 문헌이 출력되는 출력부가 포함된다.
청구항
번호청구항
3

제 2 항에 있어서, 상기 전처리부는, 어느 문헌에서, 상기 유전자와 상기 화합물이 단일의 문장에 함께 포함되는 유전자/화합물 문장부와, 상기 질병이 포함되는 문장의 질병 문장부를,서로 정렬하여 상기 임베딩부로 출력하는 유전자와 화합물과 질병의 관련문헌 추출시스템.

4

삭제

1

사용자 쿼리가 자연어로 입력되는 입력부;입력된 자연어를 개체로 인식하는 개체명 인식부;상기 개체명 인식부에서 인식된 개체를 이용하여, 유전자와 화합물과 질병과 관련되는 문헌을 제공하는 인공지능 학습모델;상기 인공지능학습모델에서 추출된 문헌을 후처리하는 후처리부; 및 상기 후처리부에서 처리되어 걸러진 문헌이 출력되는 출력부가 포함되고,상기 출력부는,유전자와 화합물이 단일의 어느 문장에 포함되고 질병이 상기 단일의 어느 문장 또는 다른 문장에 포함되는 문헌을 포함하는 포지티브; 및상기 쿼리로 입력된 유전자, 화합물, 및 질병이 모두 포함되지만, 포지티브는 아닌 문헌을 포함하는 네거티브를, 구분하여 표시하는 유전자와 화합물과 질병의 관련문헌 추출시스템.

2

제 1 항에 있어서,상기 인공지능 학습모델은 인공지능 학습장치에서 출력되는 결과물이고, 상기 인공지능 학습장치에는, 유전자와 화합물과 질병의 명칭을 문장별로 전처리하여 입력하는 전처리부;전처리된 입력정보를, 단어벡터 및 개체타입벡터으로 밀집벡터로 제작하는 임베딩부;상기 임베딩부의 출력결과를 학습하여 상기 인공지능 학습모델을 출력하는 학습부가 포함되는 유전자와 화합물과 질병의 관련문헌 추출시스템.

5

제 1 항에 있어서, 상기 후처리부는, -인식된 언급이, 인식된 언급이 개체명으로 정규화된 후에, 사전에서 개체의 동의어로 포함되지 않은 경우,-어떤 언급이 두개 이상의 개체 타입으로 인식되는 경우,-유전자, 화합물, 또는 질병을 포함하는 문장이, 공부(study)의 하위어(hyponym)를 포함하는 경우,-부정어의 의미를 가지는 단어를 포함하는 경우, 및-유전자 명과 화합물 명이 파싱트리에 의존하여 접속사로 연결되는 경우에는 상기 포지티브로 검색된 문헌을 상기 포지티브에서 제외하는 유전자와 화합물과 질병의 관련문헌 추출시스템.