설계 문서 분석 장치 및 방법
A DEVICE AND METHOD FOR ANALYZING DESIGN DOCUMENT
특허 요약
본 발명은 컴퓨팅 수단에 의해 수행되는 설계 문서 분석 방법에 관한 것으로, 설계와 관련된 적어도 하나의 텍스트 및 적어도 하나의 이미지를 포함하는 설계 문서를 획득하는 단계, 상기 획득한 설계 문서로부터 상기 적어도 하나의 텍스트 및 상기 적어도 하나의 이미지를 추출하는 단계, 상기 추출한 상기 적어도 하나의 텍스트로부터 캡션 정보를 추출하는 단계, 상기 적어도 하나의 이미지와 상기 캡션 정보를 매칭시켜 캡션-이미지 정보를 획득하는 단계 및 상기 추출한 상기 적어도 하나의 텍스트 및 상기 캡션-이미지 정보로부터 설계 변수 및 설계 변수 별 요구사항 텍스트를 획득하는 단계를 포함하는 설계 문서 분석 방법이 제공될 수 있다.
청구항
번호청구항
1

컴퓨팅 수단에 의해 수행되는 설계 문서 분석 방법에 있어서,설계와 관련된 적어도 하나의 텍스트 및 적어도 하나의 이미지를 포함하는 설계 문서를 획득하는 단계;상기 획득한 설계 문서로부터 상기 적어도 하나의 텍스트 및 상기 적어도 하나의 이미지를 추출하는 단계;상기 추출한 상기 적어도 하나의 텍스트로부터 캡션 정보를 추출하는 단계;상기 적어도 하나의 이미지와 상기 캡션 정보를 매칭시켜 캡션-이미지 정보를 획득하는 단계; 및상기 추출한 상기 적어도 하나의 텍스트 및 상기 캡션-이미지 정보로부터 설계 변수 및 설계 변수 별 요구사항 텍스트를 획득하는 단계;를 포함하고상기 설계 변수 및 설계 변수 별 요구사항 텍스트를 획득하는 단계는상기 추출한 상기 적어도 하나의 텍스트를 설계와 관련된 단어를 사전 형태로 기작성된 설계 어휘 사전과 비교하여 상기 설계 변수를 생성하는 단계;자연어 처리 모델을 이용하여 상기 설계 변수 별 요구사항 텍스트를 생성하는 단계;상기 적어도 하나의 이미지 내로부터 그림 텍스트 또는 표 텍스트를 추출하는 단계; 및상기 추출한 그림 텍스트 또는 표 텍스트와 상기 설계 변수 별 요구사항 텍스트를 비교하여 매칭시키는 단계;를 포함하고,상기 설계 변수 별 요구사항 텍스트는 상기 설계 문서의 문맥에서 상기 설계 변수에 해당하는 의미가 무엇인지 질문하는 시퀀스에 관련된 것인,설계 문서 분석 방법.

2

제1 항에 있어서,상기 캡션-이미지 정보를 획득하는 단계는표 영역과 그림 영역을 인식하도록 딥러닝으로 학습된 모델을 이용하여 상기 적어도 하나의 이미지로부터 표 영역 이미지와 그림 영역 이미지를 추출하는 단계; 및상기 표 영역 이미지 및 그림 영역 이미지에 상기 캡션 정보를 매칭시키는 단계; 를 포함하는 설계 문서 분석 방법.

3

제2 항에 있어서,상기 표 영역 이미지와 상기 그림 영역 이미지는 상기 표 영역 또는 상기 그림 영역을 기준으로 상하단 소정의 영역을 더 포함하는설계 문서 분석 방법.

4

제3 항에 있어서,상기 캡션 정보의 매칭은상기 상하단 소정의 영역으로부터 OCR(Optical Character Recognition)을 이용하여 획득한 표 캡션 정보 또는 그림 캡션 정보를 상기 캡션 정보와 비교하여 매칭되는설계 문서 분석 방법.

5

제1 항에 있어서,상기 설계 변수 및 설계 변수 별 요구사항 텍스트를 획득하는 단계는상기 추출한 상기 적어도 하나의 텍스트에 대해 자연어 처리를 위한 전처리를 수행하는 단계; 및자연어 처리 모델을 이용하여 상기 설계 변수 및 상기 설계 변수 별 요구사항 텍스트를 생성하는 단계; 를 포함하는설계 문서 분석 방법.

6

제1 항에 있어서,상기 설계 변수는 문장의 구조를 분석하도록 학습된 딥러닝 모델을 이용하여 상기 적어도 하나의 텍스트로부터 추출된 루트(Root)를 설계와 관련된 단어를 사전 형태로 기작성된 설계 어휘 사전과 비교하여 생성되는설계 문서 분석 방법.

7

제1 항에 있어서,상기 설계 변수 별 요구사항 텍스트는상기 텍스트의 상기 설계 변수가 포함된 문단으로부터 질의응답 데이터셋(SQuAD)이 학습된 딥러닝 모델을 이용하여 생성되는 설계 문서 분석 방법.

8

제1 항에 있어서,상기 설계 변수 및 설계 변수 별 요구사항 텍스트를 획득하는 단계는상기 적어도 하나의 이미지 내로부터 OCR(Optical Character Recognition)을 이용하여 그림 텍스트 또는 표 텍스트를 추출하는 단계를 포함하는설계 문서 분석 방법.

9

제1 항에 있어서,상기 그림 텍스트 또는 표 텍스트와 상기 설계 변수 별 요구사항 텍스트가 매칭된 결과를 이용하여 상기 적어도 하나의 이미지를 벡터화하는설계 문서 분석 방법.

10

제1 항에 있어서,상기 설계 변수 별 요구사항 텍스트로부터 상기 설계 변수와 혼합된 텍스트, 부등식 관련 텍스트, 표 관련 텍스트, 그림 관련 텍스트, 수식 관련 텍스트 중 적어도 하나를 식별하여 데이터테이블을 생성하고 저장하는 단계; 를 더 포함하는설계 문서 분석 방법.

11

설계 문서 분석 장치에 있어서,메모리; 및설계와 관련된 적어도 하나의 텍스트 및 적어도 하나의 이미지를 포함하는 설계 문서를 획득하고, 상기 획득한 설계 문서로부터 상기 적어도 하나의 텍스트 및 상기 적어도 하나의 이미지를 추출하고, 상기 추출한 상기 적어도 하나의 텍스트로부터 캡션 정보를 추출하고, 상기 적어도 하나의 이미지와 상기 캡션 정보를 매칭시켜 캡션-이미지 정보를 획득하고, 상기 추출한 상기 적어도 하나의 텍스트 및 상기 캡션-이미지 정보로부터 설계 변수 및 설계 변수 별 요구사항 텍스트를 획득하는 제어모듈; 을 포함하고,상기 제어모듈은상기 추출한 상기 적어도 하나의 텍스트를 설계와 관련된 단어를 사전 형태로 기작성된 설계 어휘 사전과 비교하여 상기 설계 변수를 생성하고,자연어 처리 모델을 이용하여 상기 설계 변수 별 요구사항 텍스트를 생성하고,상기 적어도 하나의 이미지 내로부터 그림 텍스트 또는 표 텍스트를 추출하고,상기 추출한 그림 텍스트 또는 표 텍스트와 상기 설계 변수 별 요구사항 텍스트를 비교하여 매칭시키며,상기 설계 변수 별 요구사항 텍스트는 상기 설계 문서의 문맥에서 상기 설계 변수에 해당하는 의미가 무엇인지 질문하는 시퀀스에 관련된 것인,설계 문서 분석 장치.