생성적 데이터 증강 전략에 기반한 대화 요약 모델 학습 방법, 시스템 및, 이를 이용한 대화 요약 방법, 시스템
METHOD AND SYSTEM FOR LEARNING A CONVERSATION SUMMARY MODEL BASED ON A GENERATIVE DATA AUGMENTATION STRATEGY, AND A CONVERSATION SUMMARY METHOD AND SYSTEM USING THE SAME
특허 요약
본 발명은, 텍스트로 이루어진 데이터 세트를 수신하고, 데이터 세트에서 복수의 화자가 포함되는 텍스트 데이터를 추출하며, 미리 학습된 대화 생성 모델에 텍스트 데이터 및, 텍스트 데이터에 포함된 복수의 화자를 입력하여, 복수의 화자 간의 대화 내용을 추론한 학습용 가상 대화 데이터를 생성하고, 텍스트로 이루어진 소정의 대화 데이터가 입력되면 대화 데이터를 요약한 요약 데이터를 출력하도록, 학습용 가상 대화 데이터 및 텍스트 데이터를 이용하여 대화 요약 모델을 학습시키는, 대화 요약 모델 학습 방법을 제공한다.
청구항
번호청구항
1

대화 요약 모델 학습 시스템을 이용한 대화 요약 모델 학습 방법에 있어서,텍스트로 이루어진 데이터 세트를 수신하는 단계;상기 데이터 세트에서 복수의 화자가 포함되는 텍스트 데이터를 추출하는 단계;미리 학습된 대화 생성 모델에 상기 텍스트 데이터 및, 상기 텍스트 데이터에 포함된 상기 복수의 화자를 입력하여, 상기 복수의 화자 간의 대화 내용을 추론한 학습용 가상 대화 데이터를 생성하는 단계; 및텍스트로 이루어진 소정의 대화 데이터가 입력되면 상기 대화 데이터를 요약한 요약 데이터를 출력하도록, 상기 학습용 가상 대화 데이터 및 상기 텍스트 데이터를 이용하여 대화 요약 모델을 학습시키는 단계를 포함하는, 대화 요약 모델 학습 방법.

2

제1 항에 있어서,상기 데이터 세트는,소정의 대화를 기반으로 요약된 텍스트가 포함되는 대화 요약 데이터 세트 및, 산문으로 작성된 텍스트가 포함되는 대규모 외부 데이터 세트를 포함하고,상기 텍스트 데이터를 추출하는 단계는,상기 대화 요약 데이터 세트 및, 상기 대규모 외부 데이터 세트에서, 상기 복수의 화자가 포함되는 상기 텍스트 데이터를 추출하는, 대화 요약 모델 학습 방법.

3

제1 항에 있어서, 상기 텍스트 데이터를 추출하는 단계는,상기 추출된 텍스트 데이터에서 동일한 대상을 가리키는 단어를 특정하는 단계;상기 특정된 단어를 고유 명사로 변환하는 단계; 및상기 텍스트 데이터로부터 나타나는 상기 복수의 화자 및, 상기 복수의 화자와 관련된 이벤트 또는, 상호작용에 대한 의미역을 분석하고, 분석 결과를 기반으로 상기 복수의 화자 및, 상기 이벤트 또는, 상호작용에 대한 레이블링을 수행하는 단계를 포함하는, 대화 요약 모델 학습 방법.

4

제1 항에 있어서, 상기 대화 생성 모델은,대화 생성 모델 학습 방법에 따라 학습된 것이고,상기 대화 생성 모델 학습 방법은,미리 정해진 학습 형식 데이터에 정답 요약 데이터, 학습용 대화 데이터에 따른 턴 레벨 텍스트, 해당 턴 레벨에서의 화자, 턴 길이 및 턴 수 중 적어도 하나를 삽입하는 단계;학습용 대화 데이터에 따른 턴 레벨 텍스트, 해당 턴 레벨에서의 화자, 턴 길이 및 턴 수 중 적어도 하나가 삽입된 학습 형식 데이터를 이용하여 대화 생성 모델을 학습시키는 단계를 포함하는, 대화 요약 모델 학습 방법.

5

제1 항에 있어서, 상기 대화 요약 모델을 학습시키는 단계는,상기 학습용 가상 대화 데이터 및 상기 텍스트 데이터를 이용하여 상기 대화 요약 모델에 대한 1 차 학습을 수행하는 단계; 및미리 구비된 학습용 대화 데이터 및, 상기 학습용 대화 데이터를 요약한 정답 요약 데이터를 이용하여 상기 대화 요약 모델에 대한 2 차 학습을 수행하는 단계를 포함하는, 대화 요약 모델 학습 방법.

6

텍스트로 이루어진 데이터 세트를 수신하는 입력부; 및텍스트로 이루어진 소정의 대화 데이터가 입력되면 상기 대화 데이터를 요약한 요약 데이터를 출력하도록, 상기 데이터 세트를 기반으로 대화 요약 모델을 학습시키는 제어부를 포함하고,상기 제어부는,상기 데이터 세트에서 복수의 화자가 포함되는 텍스트 데이터를 추출하고, 미리 학습된 대화 생성 모델에 상기 텍스트 데이터 및, 상기 텍스트 데이터에 포함된 상기 복수의 화자를 입력하여, 상기 복수의 화자 간의 대화 내용을 추론한 학습용 가상 대화 데이터를 생성하며, 상기 학습용 가상 대화 데이터 및 상기 텍스트 데이터를 이용하여 상기 대화 요약 모델을 학습시키는, 대화 요약 모델 학습 시스템.

7

전자기기에서 하나 이상의 프로세스에 의하여 실행되며, 컴퓨터로 판독될 수 있는 기록매체에 저장된 프로그램으로서,상기 프로그램은,텍스트로 이루어진 데이터 세트를 수신하는 단계;상기 데이터 세트에서 복수의 화자가 포함되는 텍스트 데이터를 추출하는 단계;미리 학습된 대화 생성 모델에 상기 텍스트 데이터 및, 상기 텍스트 데이터에 포함된 상기 복수의 화자를 입력하여, 상기 복수의 화자 간의 대화 내용을 추론한 학습용 가상 대화 데이터를 생성하는 단계; 및텍스트로 이루어진 소정의 대화 데이터가 입력되면 상기 대화 데이터를 요약한 요약 데이터를 출력하도록, 상기 학습용 가상 대화 데이터 및 상기 텍스트 데이터를 이용하여 대화 요약 모델을 학습시키는 단계를 수행하도록 하는 명령어들을 포함하는 것을 특징으로 하는 컴퓨터로 판독될 수 있는 기록매체에 저장된 프로그램.

8

대화 요약 시스템을 이용한 대화 요약 방법에 있어서,텍스트로 이루어진 소정의 대화 데이터를 수신하는 단계; 및미리 학습된 대화 요약 모델에 상기 대화 데이터를 입력하여, 상기 대화 데이터를 요약한 요약 데이터를 생성하는 단계를 포함하고,상기 대화 요약 모델은, 대화 요약 모델 학습 방법에 따라 학습된 것이며,상기 대화 요약 모델 학습 방법은,텍스트로 이루어진 데이터 세트를 수신하는 단계;상기 데이터 세트에서 복수의 화자가 포함되는 텍스트 데이터를 추출하는 단계;미리 학습된 대화 생성 모델에 상기 텍스트 데이터 및, 상기 텍스트 데이터에 포함된 상기 복수의 화자를 입력하여, 상기 복수의 화자 간의 대화 내용을 추론한 학습용 대화 데이터를 생성하는 단계; 및상기 학습용 대화 데이터 및 상기 텍스트 데이터를 이용하여 대화 요약 모델을 학습시키는 단계를 포함하는, 대화 요약 방법.

9

텍스트로 이루어진 소정의 대화 데이터를 수신하는 입력부; 및미리 학습된 대화 요약 모델에 상기 대화 데이터를 입력하여, 상기 대화 데이터를 요약한 요약 데이터를 생성하는 제어부를 포함하고,상기 대화 요약 모델은, 대화 요약 모델 학습 방법에 따라 학습된 것이며,상기 대화 요약 모델 학습 방법은,텍스트로 이루어진 데이터 세트를 수신하는 단계;상기 데이터 세트에서 복수의 화자가 포함되는 텍스트 데이터를 추출하는 단계;미리 학습된 대화 생성 모델에 상기 텍스트 데이터 및, 상기 텍스트 데이터에 포함된 상기 복수의 화자를 입력하여, 상기 복수의 화자 간의 대화 내용을 추론한 학습용 대화 데이터를 생성하는 단계; 및상기 학습용 대화 데이터 및 상기 텍스트 데이터를 이용하여 대화 요약 모델을 학습시키는 단계를 포함하는, 대화 요약 시스템.

10

전자기기에서 하나 이상의 프로세스에 의하여 실행되며, 컴퓨터로 판독될 수 있는 기록매체에 저장된 프로그램으로서,상기 프로그램은,텍스트로 이루어진 소정의 대화 데이터를 수신하는 단계; 및미리 학습된 대화 요약 모델에 상기 대화 데이터를 입력하여, 상기 대화 데이터를 요약한 요약 데이터를 생성하는 단계를 수행하도록 하는 명령어들을 포함하고,상기 대화 요약 모델은, 대화 요약 모델 학습 방법에 따라 학습된 것이며,상기 대화 요약 모델 학습 방법은,텍스트로 이루어진 데이터 세트를 수신하는 단계;상기 데이터 세트에서 복수의 화자가 포함되는 텍스트 데이터를 추출하는 단계;미리 학습된 대화 생성 모델에 상기 텍스트 데이터 및, 상기 텍스트 데이터에 포함된 상기 복수의 화자를 입력하여, 상기 복수의 화자 간의 대화 내용을 추론한 학습용 대화 데이터를 생성하는 단계; 및상기 학습용 대화 데이터 및 상기 텍스트 데이터를 이용하여 대화 요약 모델을 학습시키는 단계를 포함하는 것을 특징으로 하는 컴퓨터로 판독될 수 있는 기록매체에 저장된 프로그램.