| 번호 | 청구항 |
|---|---|
| 1 | 전자 장치에 의해, 수신되는 타겟 문서로부터 목적하는 서류를 자동으로 생성하기 위한 방법으로서,상기 타겟 문서에서 섹션(section)화의 기준이 되는 앵커 텍스트를 적어도 두 개 이상 추출하는 단계;상기 추출된 적어도 두 개 이상의 앵커 텍스트 각각을 기준으로 상기 타겟 문서를 복수 개의 섹션으로 분획하는 단계;상기 복수 개의 섹션 각각의 타입에 대응되는 키 정보 추출 모델을 로딩하고, 상기 로딩된 각각의 키 정보 추출 모델을 이용하여, 상기 복수 개의 섹션 각각에서 키 정보를 추출하는 단계; 및상기 복수 개의 섹션 각각으로부터 추출된 키 정보를 이용해서 상기 타겟 문서에 대한 파싱 분석을 수행하는 단계를 포함하는, 방법. |
| 2 | 제1항에 있어서,상기 추출된 키 정보와 상기 타겟 문서를 분석한 결과에 기초해, 소정의 서류 규격에 따라 목적하는 서류를 자동으로 생성하는 단계를 더 포함하는, 방법. |
| 3 | 제1항에 있어서,상기 앵커 텍스트는,복수 개의 문서 각각을 두 개 이상의 섹션으로 구분했을 때, 상기 구분된 각 섹션에 포함된 각각의 텍스트가 갖는 고유한 정도에 기초해서 선정된 것을 특징으로 하는, 방법. |
| 4 | 제3항에 있어서,상기 고유한 정도는,상기 타겟 문서의 종류 내지 용도에 따라 상이하게 결정되는 것을 특징으로 하는, 방법. |
| 5 | 제3항에 있어서,상기 고유한 정도는,인공지능에 기반하여 복수개의 문서 내 섹션의 위치 및 섹션별 텍스트의 상관도가 학습된 인공지능 모델을 통하여 산출되는 것을 특징으로 하는, 방법. |
| 6 | 제1항에 있어서,상기 섹션의 분획에는,상기 추출된 앵커 텍스트의 위치를 기준으로 하는 바운딩 박스가 이용되는 것을 특징으로 하는, 방법. |
| 7 | 제1항에 있어서,상기 섹션의 분획은,상기 타겟 문서에 대한 이미지로부터 레이아웃을 감지하도록 기 학습된 모델에 의해 수행되는 것을 특징으로 하는, 방법. |
| 8 | 제1항에 있어서,상기 키 정보 추출 모델의 로딩은,상기 복수 개의 섹션 각각에서 추출된 특성과 미리 마련된 상기 복수 개의 키 정보 추출 모델 각각의 특성 간의 매칭 정도에 따라 선택된 키 정보 추출 모델이 로딩되는 것을 특징으로 하는, 방법. |
| 9 | 제8항에 있어서,상기 복수 개의 키 정보 추출 모델은,서로 간에 특성 추출 방식, 분석 대상의 범위 및 학습된 패턴 중 적어도 하나에 의해 구분되는 것을 특징으로 하는, 방법. |
| 10 | 타겟 문서에서 섹션(section)화의 기준이 되는 앵커 텍스트를 적어도 두 개 이상 추출하는 단계;상기 추출된 적어도 두 개 이상의 앵커 텍스트 각각을 기준으로 상기 타겟 문서를 복수 개의 섹션으로 분획하는 단계;상기 복수 개의 섹션 각각의 타입에 대응되는 키 정보 추출 모델을 로딩하고, 상기 로딩된 각각의 키 정보 추출 모델을 이용하여, 상기 복수 개의 섹션 각각에서 키 정보를 추출하는 단계; 및상기 복수 개의 섹션 각각으로부터 추출된 키 정보를 이용해서 상기 타겟 문서에 대한 파싱 분석을 수행하는 단계를 포함하도록 프로그램된 컴퓨터 프로그램을 저장하는 컴퓨터 판독가능한 기록매체. |