경량화된 모델을 이용한 텍스트 인식 장치 및 그 동작 방법
TEXT RECOGNITION DEVICE USING A LIGHTWEIGHT MODEL AND METHOD OF OPERATION THEREOF
특허 요약
본 발명은 텍스트 인식 기술에 관한 것으로서, 보다 상세하게는 경량화된 텍스트 인식 모델을 이용하여 신분증 이미지로부터 텍스트를 인식하는 기술에 관한 것이다. 본 발명의 일 측면에 따르면, 경량화된 모델을 이용한 텍스트 인식 방법은, 타겟 신분증 이미지를 획득하는 단계; 타겟 신분증 이미지로부터 텍스트 영역을 검출하는 단계; 경량화된 텍스트 인식 모델을 이용하여, 검출된 텍스트 영역으로부터 텍스트를 인식하는 단계; 및 텍스트 인식 결과를 출력하는 단계;를 포함할 수 있다.
청구항
번호청구항
10

타겟 신분증 이미지를 획득하는 입력부;상기 타겟 신분증 이미지로부터 텍스트 영역을 검출하는 텍스트 영역 검출부;경량화된 텍스트 인식 모델을 이용하여, 검출된 텍스트 영역으로부터 텍스트를 인식하는 텍스트 인식부; 및텍스트 인식 결과를 출력하는 출력부;를 포함하는, 경량화된 모델을 이용한 텍스트 인식 장치.

1

타겟 신분증 이미지를 획득하는 단계;상기 타겟 신분증 이미지로부터 텍스트 영역을 검출하는 단계;경량화된 텍스트 인식 모델을 이용하여, 검출된 텍스트 영역으로부터 텍스트를 인식하는 단계; 및텍스트 인식 결과를 출력하는 단계;를 포함하는, 경량화된 모델을 이용한 텍스트 인식 방법.

2

제1항에 있어서,상기 경량화된 텍스트 인식 모델은, 복수의 신분증 이미지 데이터 각각으로부터 텍스트 영역을 추출하고, 추출된 텍스트 영역을 기반으로 텍스트 인식 모델을 학습시키고, 학습된 텍스트 인식 모델에 지식 증류 기법(KNOWLEDGE DISTILLATION)을 적용하여 모델 경량화함으로써, 생성된 텍스트 인식 모델인, 경량화된 모델을 이용한 텍스트 인식 방법.

3

제1항에 있어서,복수의 방향 및 각도 중 적어도 하나에 따라 상기 타겟 신분증 이미지를 회전시켜, 적어도 하나의 회전된 타겟 신분증 이미지를 생성하는 단계;를 더 포함하되,상기 타겟 신분증 이미지로부터 텍스트 영역을 검출하는 단계는,상기 적어도 하나의 회전된 타겟 신분증 이미지로부터 텍스트 영역을 더 검출하고,상기 텍스트 인식 결과를 출력하는 단계는, 상기 타겟 신분증 이미지 및 상기 적어도 하나의 회전된 타겟 신분증 이미지 각각에 대한 텍스트 인식 결과를 비교하여, 상기 타겟 신분증 이미지 및 상기 적어도 하나의 회전된 타겟 신분증 이미지 중 신뢰도가 가장 높은 이미지로부터 인식된 텍스트 인식 결과를 출력하는, 경량화된 모델을 이용한 텍스트 인식 방법.

4

제1항에 있어서,상기 타겟 신분증 이미지를 획득하는 단계는, 상기 타겟 신분증 이미지가 좌우반전된 이미지인 경우, 상기 획득된 타겟 신분증 이미지에 대한 좌우반전을 수행하고, 상기 타겟 신분증 이미지로부터 텍스트 영역을 검출하는 단계는,좌우반전이 수행된 타겟 신분증 이미지로부터 상기 텍스트 영역을 검출하는, 경량화된 모델을 이용한 텍스트 인식 방법.

5

제1항에 있어서,상기 타겟 신분증 이미지로부터 텍스트 영역을 검출하는 단계는,상기 타겟 신분증 이미지를 이진화하여, 상기 타겟 신분증 이미지에서 텍스트가 포함된 영역을 추출하는 단계; 및추출된 텍스트가 포함된 영역된 영역에서 비 텍스트 영역과 상기 텍스트 영역을 구분하여, 상기 텍스트 영역에 바운딩 박스를 생성함으로써, 상기 텍스트 영역을 검출하는 단계;를 포함하는, 경량화된 모델을 이용한 텍스트 인식 방법.

6

제2항에 있어서,상기 학습된 텍스트 인식 모델은, 상기 학습된 텍스트 인식 모델을 제1 선생 모델로 하여 지식 증류 기법을 적용함으로써 제1 학생 모델이 1차 경량화되고, 상기 제1 학습 모델을 제2 선생 모델로 하여 지식 증류 기법을 적용함으로써 2차 경량화된 제2 학생 모델인,경량화된 모델을 이용한 텍스트 인식 방법.

7

제6항에 있어서,상기 제1 학생 모델의 파라미터는 상기 제1 선생 모델의 파라미터의 1/5이고, 상기 제2 학생 모델의 파라미터는 상기 제2 선생 모델의 파라미터의 1/5인, 경량화된 모델을 이용한 텍스트 인식 방법.

8

제1항에 있어서, 상기 타겟 신분증 이미지로부터 텍스트 영역을 검출하는 단계는, DBnet 모델을 이용하여 상기 타겟 신분증 이미지로부터 텍스트 영역을 검출하는, 경량화된 모델을 이용한 텍스트 인식 방법.

9

제1항에 있어서, 상기 텍스트 인식 모델은, TROCR 모델인, 경량화된 모델을 이용한 텍스트 인식 방법.

11

제10항에 있어서,상기 경량화된 텍스트 인식 모델은, 복수의 신분증 이미지 데이터 각각으로부터 텍스트 영역을 추출하고, 추출된 텍스트 영역을 기반으로 텍스트 인식 모델을 학습시키고, 학습된 텍스트 인식 모델에 지식 증류 기법(KNOWLEDGE DISTILLATION)을 적용하여 모델 경량화함으로써, 생성된 텍스트 인식 모델인, 경량화된 모델을 이용한 텍스트 인식 장치.

12

제10항에 있어서,상기 텍스트 영역 검출부는, 복수의 방향 및 각도 중 적어도 하나에 따라 상기 타겟 신분증 이미지를 회전시켜, 적어도 하나의 회전된 타겟 신분증 이미지를 생성하고, 상기 적어도 하나의 회전된 타겟 신분증 이미지로부터 텍스트 영역을 더 검출하고,상기 텍스트 인식부는, 상기 타겟 신분증 이미지 및 상기 적어도 하나의 회전된 타겟 신분증 이미지 각각에 대한 텍스트 인식 결과를 비교하여, 상기 타겟 신분증 이미지 및 상기 적어도 하나의 회전된 타겟 신분증 이미지 중 신뢰도가 가장 높은 이미지로부터 인식된 텍스트 인식 결과를 선택하는, 경량화된 모델을 이용한 텍스트 인식 장치.

13

제10항에 있어서,상기 텍스트 영역 검출부는, 상기 타겟 신분증 이미지가 좌우반전된 이미지인 경우, 상기 획득된 타겟 신분증 이미지에 대한 좌우반전을 수행하고, 좌우반전이 수행된 타겟 신분증 이미지로부터 상기 텍스트 영역을 검출하는, 경량화된 모델을 이용한 텍스트 인식 장치.

14

제1-항에 있어서,상기 텍스트 영역 검출부는,상기 타겟 신분증 이미지를 이진화하여, 상기 타겟 신분증 이미지에서 텍스트가 포함된 영역을 추출하고, 추출된 텍스트가 포함된 영역된 영역에서 비 텍스트 영역과 상기 텍스트 영역을 구분하여, 상기 텍스트 영역에 바운딩 박스를 생성함으로써, 상기 텍스트 영역을 검출하는, 경량화된 모델을 이용한 텍스트 인식 장치.

15

제11항에 있어서,상기 학습된 텍스트 인식 모델은, 상기 학습된 텍스트 인식 모델을 제1 선생 모델로 하여 지식 증류 기법을 적용함으로써 제1 학생 모델이 1차 경량화되고, 상기 제1 학습 모델을 제2 선생 모델로 하여 지식 증류 기법을 적용함으로써 2차 경량화된 제2 학생 모델인,경량화된 모델을 이용한 텍스트 인식 장치.

16

제15항에 있어서,상기 제1 학생 모델의 파라미터는 상기 제1 선생 모델의 파라미터의 1/5이고, 상기 제2 학생 모델의 파라미터는 상기 제2 선생 모델의 파라미터의 1/5인, 경량화된 모델을 이용한 텍스트 인식 장치.

17

제10항에 있어서, 상기 텍스트 영역 검출부는, DBnet 모델을 이용하여 상기 타겟 신분증 이미지로부터 텍스트 영역을 검출하는, 경량화된 모델을 이용한 텍스트 인식 장치.

18

제10항에 있어서, 상기 텍스트 인식 모델은, TROCR 모델인, 경량화된 모델을 이용한 텍스트 인식 장치.

19

메모리; 및 상기 명령어를 실행함으로써, 타겟 신분증 이미지를 획득하는 단계; 상기 타겟 신분증 이미지로부터 텍스트 영역을 검출하는 단계; 경량화된 텍스트 인식 모델을 이용하여, 검출된 텍스트 영역으로부터 텍스트를 인식하는 단계; 및 텍스트 인식 결과를 출력하는 단계;를 포함하는, 경량화된 모델을 이용한 텍스트 인식 방법을 수행하는, 프로세서;를 포함하는, 경량화된 모델을 이용한 텍스트 인식 장치.

20

컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체로서,상기 컴퓨터 프로그램은, 프로세서에 의해 실행되면, 타겟 신분증 이미지를 획득하는 단계; 상기 타겟 신분증 이미지로부터 텍스트 영역을 검출하는 단계; 경량화된 텍스트 인식 모델을 이용하여, 검출된 텍스트 영역으로부터 텍스트를 인식하는 단계; 및 텍스트 인식 결과를 출력하는 단계;를 포함하는, 경량화된 모델을 이용한 텍스트 인식 방법을 상기 프로세서가 수행하도록 하기 위한 명령어를 포함하는,컴퓨터 판독 가능한 기록매체.