질의 중심 기반의 문서 요약 장치, 방법, 컴퓨터 판독 가능한 기록 매체 및 컴퓨터 프로그램
APPARATUS, METHOD, COMPUTER-READABLE STORAGE MEDIUM AND COMPUTER PROGRAM FOR SUMMARIZING DOCUMENT BASED ON QUERY ATTENTION
특허 요약
본 발명은 문서에서 질의와 관련성이 높은 내용을 요약하여 제공하는 문서 요약 기술에 관한 것이다.
청구항
번호청구항
5

제4항에 있어서,상기 의존관계는 디펜던시 파싱(dependency parsing) 기법에 따라 결정되고, 상기 동일한 의미를 갖는 단어들을 하나의 노드로 표현하는 것은 상호참조해결(Coreference resolution) 기법에 따라 결정되는, 질의 중심 기반의 문서 요약 장치.

1

질의 텍스트 및 상기 질의 텍스트에 대응되는 컨텐트를 포함하는 문서 텍스트를 기반으로 문맥 임베딩을 생성하는 문맥 인베딩 생성부;상기 문맥 임베딩을 기반으로 상기 질의 텍스트 및 문서 텍스트에 포함된 단어들의 관계를 표현하는 질의 중심 의미 그래프를 생성하고, 상기 질의 중심 의미 그래프를 임베딩하여 그래프 임베딩을 생성하는 그래프 임베딩 생성부;상기 문맥 임베딩 중 상기 질의 텍스트에 대응되는 임베딩과 상기 그래프 임베딩 중 상기 문서 텍스트에 대응되는 임베딩을 융합하여 제1 융합 정보를 생성하고, 상기 문맥 임베딩 중 상기 문서 텍스트에 대응되는 임베딩과 상기 그래프 임베딩 중 상기 질의 텍스트에 대응되는 임베딩을 융합하여 제2 융합 정보를 생성하며, 상기 제1 융합 정보 및 제2 융합 정보를 기반으로, 상기 그래프 임베딩 정보를 포함하는 문맥 임베딩인 융합 문맥 임베딩 및 상기 문맥 임베딩 정보를 포함하는 그래프 임베딩인 융합 그래프 임베딩을 생성하는 임베딩 융합부;상기 융합 문맥 임베딩 및 융합 그래프 임베딩을 기반으로, 상기 문서 텍스트에 포함된 컨텐트를 요약한 요약 텍스트를 생성하는 요약 생성부;를 포함하는, 질의 중심 기반의 문서 요약 장치.

2

제1항에 있어서,상기 문맥 임베딩을 생성하는 단계는,자연어 처리 모델을 이용하여 상기 질의 텍스트 및 문서 텍스트를 임베딩하는, 질의 중심 기반의 문서 요약 장치.

3

제1항에 있어서,상기 질의 중심 의미 그래프는, 상기 질의 텍스트 및 문서 텍스트에 포함된 단어들이 노드들로 표현되고, 상기 질의 텍스트 및 문서 텍스트에 포함된 단어들의 관계에 따라 상기 노드들이 연결되는, 질의 중심 기반의 문서 요약 장치.

4

제3항에 있어서,상기 질의 중심 의미 그래프는,상기 노드들이 단어의 의존관계에 따라 연결되고, 동일한 의미를 갖는 단어들은 하나의 노드로 표현되며, 상기 텍스트의 루트 단어에 대응하는 노드들과 상기 문서 텍스트의 루트 단어에 대응하는 노드들이 연결되는, 질의 중심 기반의 문서 요약 장치.

6

제4항에 있어서,상기 임베딩 융합부는,상기 질의 중심 의미 그래프를 임베딩하여 임시 그래프 임베딩을 생성하고, 상기 임시 그래프 임베딩을 기반으로 상기 문서 텍스트에 포함된 단어에 대응하는 노드들의 상기 질의 텍스트에 포함된 단어에 대응하는 노드들에 대한 중요도와, 상기 질의 중심 의미 그래프에 포함된 노드들 간의 유사도를 계산하며, 상기 중요도 및 유사도를 기반으로 상기 임시 그래프 임베딩을 업데이트하여 상기 그래프 임베딩을 생성하는, 질의 중심 기반의 문서 요약 장치.

7

제6항에 있어서,상기 중요도는 PageRank 기법에 의해 결정되는, 질의 중심 기반의 문서 요약 장치.

8

제1항에 있어서,상기 제1 융합 정보 및 제2 융합 정보는다층 퍼셉트론(multi-layer perceptron, MLP) 신경망을 이용하여 생성되는, 질의 중심 기반의 문서 요약 장치.

9

제1항에 있어서,상기 요약 생성부는, 상기 융합 문맥 임베딩 및 융합 그래프 임베딩 각각으로부터 어텐션을 추출하고, 추출된 어텐션을 융합하여 요약 텍스트를 생성하는, 질의 중심 기반의 문서 요약 장치.

10

질의 중심 기반의 문서 요약 장치가 수행하는 문서 요약 방법으로서,질의 텍스트 및 상기 질의 텍스트에 대응되는 컨텐트를 포함하는 문서 텍스트를 기반으로 문맥 임베딩을 생성하는 단계;상기 문맥 임베딩을 기반으로 상기 질의 텍스트 및 문서 텍스트에 포함된 단어들의 관계를 표현하는 질의 중심 의미 그래프를 생성하고, 상기 질의 중심 의미 그래프를 임베딩하여 그래프 임베딩을 생성하는 단계;상기 문맥 임베딩 중 상기 질의 텍스트에 대응되는 임베딩과 상기 그래프 임베딩 중 상기 문서 텍스트에 대응되는 임베딩을 융합하여 제1 융합 정보를 생성하는 단계;상기 문맥 임베딩 중 상기 문서 텍스트에 대응되는 임베딩과 상기 그래프 임베딩 중 상기 질의 텍스트에 대응되는 임베딩을 융합하여 제2 융합 정보를 생성하는 단계;상기 제1 융합 정보 및 제2 융합 정보를 기반으로, 상기 그래프 임베딩 정보를 포함하는 문맥 임베딩인 융합 문맥 임베딩 및 상기 문맥 임베딩 정보를 포함하는 그래프 임베딩인 융합 그래프 임베딩을 생성하는 단계; 및상기 융합 문맥 임베딩 및 융합 그래프 임베딩을 기반으로, 상기 문서 텍스트에 포함된 컨텐트를 요약한 요약 텍스트를 생성하는 단계;를 포함하는, 질의 중심 기반의 문서 요약 방법.

11

제10항에 있어서,상기 문맥 임베딩을 생성하는 단계는,자연어 처리 모델을 이용하여 상기 질의 텍스트 및 문서 텍스트를 임베딩하는, 질의 중심 기반의 문서 요약 방법.

12

제10항에 있어서,상기 질의 중심 의미 그래프는, 상기 질의 텍스트 및 문서 텍스트에 포함된 단어들이 노드들로 표현되고, 상기 질의 텍스트 및 문서 텍스트에 포함된 단어들의 관계에 따라 상기 노드들이 연결되는, 질의 중심 기반의 문서 요약 방법.

13

제12항에 있어서,상기 질의 중심 의미 그래프는,상기 노드들이 단어의 의존관계에 따라 연결되고, 동일한 의미를 갖는 단어들은 하나의 노드로 표현되며, 상기 텍스트의 루트 단어에 대응하는 노드들과 상기 문서 텍스트의 루트 단어에 대응하는 노드들이 연결되는, 질의 중심 기반의 문서 요약 방법.

14

제13항에 있어서,상기 의존관계는 디펜던시 파싱(dependency parsing) 기법에 따라 결정되고, 상기 동일한 의미를 갖는 단어들을 하나의 노드로 표현하는 것은 상호참조해결(Coreference resolution) 기법에 따라 결정되는, 질의 중심 기반의 문서 요약 방법.

15

제13항에 있어서,상기 그래프 임베딩을 생성하는 단계는,상기 질의 중심 의미 그래프를 임베딩하여 임시 그래프 임베딩을 생성하는 단계;상기 임시 그래프 임베딩을 기반으로, 상기 문서 텍스트에 포함된 단어에 대응하는 노드들의 상기 질의 텍스트에 포함된 단어에 대응하는 노드들에 대한 중요도와, 상기 질의 중심 의미 그래프에 포함된 노드들 간의 유사도를 계산하는 단계; 및상기 중요도 및 유사도를 기반으로 상기 임시 그래프 임베딩을 업데이트하여 상기 그래프 임베딩을 생성하는 단계;를 포함하는, 질의 중심 기반의 문서 요약 방법.

16

제15항에 있어서,상기 중요도는 PageRank 기법에 의해 결정되는, 질의 중심 기반의 문서 요약 방법.

17

제10항에 있어서,상기 제1 융합 정보 및 제2 융합 정보는다층 퍼셉트론(multi-layer perceptron, MLP) 신경망을 이용하여 생성되는, 질의 중심 기반의 문서 요약 방법.

18

제10항에 있어서,상기 요약 텍스트를 생성하는 단계는, 상기 융합 문맥 임베딩 및 융합 그래프 임베딩 각각으로부터 어텐션을 추출하고, 추출된 어텐션을 융합하여 요약 텍스트를 생성하는, 질의 중심 기반의 문서 요약 방법.

19

컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독 가능 기록매체로서,질의 텍스트 및 상기 질의 텍스트에 대응되는 컨텐트를 포함하는 문서 텍스트를 기반으로 문맥 임베딩을 생성하는 단계;상기 문맥 임베딩을 기반으로 상기 질의 텍스트 및 문서 텍스트에 포함된 단어들의 관계를 표현하는 질의 중심 의미 그래프를 생성하고, 상기 질의 중심 의미 그래프를 임베딩하여 그래프 임베딩을 생성하는 단계;상기 문맥 임베딩 중 상기 질의 텍스트에 대응되는 임베딩과 상기 그래프 임베딩 중 상기 문서 텍스트에 대응되는 임베딩을 융합하여 제1 융합 정보를 생성하는 단계;상기 문맥 임베딩 중 상기 문서 텍스트에 대응되는 임베딩과 상기 그래프 임베딩 중 상기 질의 텍스트에 대응되는 임베딩을 융합하여 제2 융합 정보를 생성하는 단계;상기 제1 융합 정보 및 제2 융합 정보를 기반으로, 상기 그래프 임베딩 정보를 포함하는 문맥 임베딩인 융합 문맥 임베딩 및 상기 문맥 임베딩 정보를 포함하는 그래프 임베딩인 융합 그래프 임베딩을 생성하는 단계; 및상기 융합 문맥 임베딩 및 융합 그래프 임베딩을 기반으로, 상기 문서 텍스트에 포함된 컨텐트를 요약한 요약 텍스트를 생성하는 단계;를 포함하는, 질의 중심 기반의 문서 요약 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함하는, 컴퓨터 판독 가능한 기록매체.

20

컴퓨터 판독 가능한 기록매체에 저장되어 있는 컴퓨터 프로그램으로서,질의 텍스트 및 상기 질의 텍스트에 대응되는 컨텐트를 포함하는 문서 텍스트를 기반으로 문맥 임베딩을 생성하는 단계;상기 문맥 임베딩을 기반으로 상기 질의 텍스트 및 문서 텍스트에 포함된 단어들의 관계를 표현하는 질의 중심 의미 그래프를 생성하고, 상기 질의 중심 의미 그래프를 임베딩하여 그래프 임베딩을 생성하는 단계;상기 문맥 임베딩 중 상기 질의 텍스트에 대응되는 임베딩과 상기 그래프 임베딩 중 상기 문서 텍스트에 대응되는 임베딩을 융합하여 제1 융합 정보를 생성하는 단계;상기 문맥 임베딩 중 상기 문서 텍스트에 대응되는 임베딩과 상기 그래프 임베딩 중 상기 질의 텍스트에 대응되는 임베딩을 융합하여 제2 융합 정보를 생성하는 단계;상기 제1 융합 정보 및 제2 융합 정보를 기반으로, 상기 그래프 임베딩 정보를 포함하는 문맥 임베딩인 융합 문맥 임베딩 및 상기 문맥 임베딩 정보를 포함하는 그래프 임베딩인 융합 그래프 임베딩을 생성하는 단계; 및상기 융합 문맥 임베딩 및 융합 그래프 임베딩을 기반으로, 상기 문서 텍스트에 포함된 컨텐트를 요약한 요약 텍스트를 생성하는 단계;를 포함하는, 질의 중심 기반의 문서 요약 방법을 프로세서가 수행하도록 하기 위한 명령어를 프로세서가 수행하도록 하기 위한 명령어를 포함하는, 컴퓨터 프로그램.