동적 리소스 적응형 딥러닝 모델 추론 방법 및 상기 방법을 수행하는 딥러닝 모델 추론 장치
INFERENCE METHOD USING DYNAMIC RESOURCE-BASED ADAPTIVE DEEP LEARNING MODEL AND DEEP LEARNING MODEL INFERENCE DEVICE PERFORMING METHOD
특허 요약
본 발명의 일 실시예에 따른 동적 리소스 적응형 딥러닝 모델 추론 방법은, 모바일 단말에 관한 리소스 정보를 획득하는 단계; 상기 모바일 단말에 관한 리소스 정보를 참조하여 결정되는 할당 가능 리소스에 기초하여 제1 딥러닝 모델을 제2 딥러닝 모델로 경량화하는 단계; 및 상기 모바일 단말 내에서 상기 제2 딥러닝 모델을 이용하여 추론을 수행하는 단계를 포함할 수 있다.
청구항
번호청구항
1

동적 리소스 적응형 딥러닝 모델 추론 방법에 있어서,모바일 단말에 관한 리소스 정보를 획득하는 단계;상기 모바일 단말에 관한 리소스 정보를 참조하여 결정되는 할당 가능 리소스에 기초하여 제1 딥러닝 모델을 제2 딥러닝 모델로 경량화하는 단계; 및상기 모바일 단말 내에서 상기 제2 딥러닝 모델을 이용하여 추론을 수행하는 단계를 포함하고,상기 제1 딥러닝 모델을 제2 딥러닝 모델로 경량화하는 단계는,상기 제1 딥러닝 모델에 관한 리소스 정보를 추정하는 단계;상기 모바일 단말에 관한 리소스 정보 및 상기 제1 딥러닝 모델에 관한 리소스 정보를 참조하여 상기 할당 가능 리소스를 결정하는 단계;상기 제1 딥러닝 모델에 관한 리소스 정보에 포함되는 소정의 제1 값들과 상기 모바일 단말에 관한 리소스 정보에 포함되는 소정의 제2 값들의 비율 중 최소 비율과 연관된 목표 경량화 비율을 결정하는 단계; 및상기 목표 경량화 비율에 기초하여 상기 제1 딥러닝 모델에 포함된 레이어의 수를 조절하는 단계를 더 포함하는딥러닝 모델 추론 방법.

2

제1 항에 있어서,상기 모바일 단말에 관한 리소스 정보는 상기 모바일 단말의 하드웨어 정보, 소프트웨어 정보, 저장 공간 용량 정보, 메모리 사용량 정보, CPU 사용량 정보 및 GPU/NPU 사용량 정보 중 적어도 하나를 포함하는딥러닝 모델 추론 방법.

3

제1 항에 있어서,상기 모바일 단말에 관한 리소스 정보는 시간의 흐름에 기초하여 변하는딥러닝 모델 추론 방법.

4

삭제

5

제1 항에 있어서,상기 할당 가능 리소스는 상기 모바일 단말 내에서 추론을 시작하는 시점에서의 상기 모바일 단말에 관한 리소스 정보를 참조하여 결정되는 것이고, 상기 추론은 상기 제1 딥러닝 모델이 상기 제2 딥러닝 모델로 경량화됨과 동시에 수행되는 것인딥러닝 모델 추론 방법.

6

삭제

7

동적 리소스 적응형 딥러닝 모델 추론 장치로서,딥러닝 모델 추론 프로그램이 저장된 메모리; 및상기 메모리에서 상기 딥러닝 모델 추론 프로그램을 로드하여, 상기 딥러닝 모델 추론 프로그램을 실행하는 프로세서를 포함하고,상기 프로세서는,모바일 단말에 관한 리소스 정보를 획득하고,상기 모바일 단말에 관한 리소스 정보를 참조하여 결정되는 할당 가능 리소스에 기초하여 제1 딥러닝 모델을 제2 딥러닝 모델로 경량화하고,상기 모바일 단말 내에서 상기 제2 딥러닝 모델을 이용하여 추론을 수행하되,상기 프로세서는,상기 제1 딥러닝 모델에 관한 리소스 정보를 추정하고,상기 모바일 단말에 관한 리소스 정보 및 상기 제1 딥러닝 모델에 관한 리소스 정보를 참조하여 상기 할당 가능 리소스를 결정하고,상기 제1 딥러닝 모델에 관한 리소스 정보에 포함되는 소정의 제1 값들과 상기 모바일 단말에 관한 리소스 정보에 포함되는 소정의 제2 값들의 비율 중 최소 비율과 연관된 목표 경량화 비율을 결정하고,상기 목표 경량화 비율에 기초하여 상기 제1 딥러닝 모델에 포함된 레이어의 수를 조절하는딥러닝 모델 추론 장치.

8

제7 항에 있어서,상기 모바일 단말에 관한 리소스 정보는 상기 모바일 단말의 하드웨어 정보, 소프트웨어 정보, 저장 공간 용량 정보, 메모리 사용량 정보, CPU 사용량 정보 및 GPU/NPU 사용량 정보 중 적어도 하나를 포함하는딥러닝 모델 추론 장치.

9

제7 항에 있어서,상기 모바일 단말에 관한 리소스 정보는 시간의 흐름에 기초하여 변하는딥러닝 모델 추론 장치.

10

삭제

11

제7 항에 있어서,상기 할당 가능 리소스는 상기 모바일 단말 내에서 추론을 시작하는 시점에서의 상기 모바일 단말에 관한 리소스 정보를 참조하여 결정되는 것이고, 상기 추론은 상기 제1 딥러닝 모델이 상기 제2 딥러닝 모델로 경량화됨과 동시에 수행되는 것인딥러닝 모델 추론 장치.

12

삭제

13

컴퓨터 프로그램을 저장하고 있는 컴퓨터 판독 가능 기록매체로서,모바일 단말에 관한 리소스 정보를 획득하는 단계;상기 모바일 단말에 관한 리소스 정보를 참조하여 결정되는 할당 가능 리소스에 기초하여 제1 딥러닝 모델을 제2 딥러닝 모델로 경량화하는 단계; 및상기 모바일 단말 내에서 상기 제2 딥러닝 모델을 이용하여 추론을 수행하는 단계를 포함하고,상기 제1 딥러닝 모델을 제2 딥러닝 모델로 경량화하는 단계는,상기 제1 딥러닝 모델에 관한 리소스 정보를 추정하는 단계;상기 모바일 단말에 관한 리소스 정보 및 상기 제1 딥러닝 모델에 관한 리소스 정보를 참조하여 상기 할당 가능 리소스를 결정하는 단계;상기 제1 딥러닝 모델에 관한 리소스 정보에 포함되는 소정의 제1 값들과 상기 모바일 단말에 관한 리소스 정보에 포함되는 소정의 제2 값들의 비율 중 최소 비율과 연관된 목표 경량화 비율을 결정하는 단계; 및상기 목표 경량화 비율에 기초하여 상기 제1 딥러닝 모델에 포함된 레이어의 수를 조절하는 단계를 더 포함하는 동적 리소스 적응형 딥러닝 모델 추론 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함하는컴퓨터 판독 가능한 기록매체.

14

컴퓨터 판독 가능한 기록매체에 저장되어 있는 컴퓨터 프로그램으로서,모바일 단말에 관한 리소스 정보를 획득하는 단계;상기 모바일 단말에 관한 리소스 정보를 참조하여 결정되는 할당 가능 리소스에 기초하여 제1 딥러닝 모델을 제2 딥러닝 모델로 경량화하는 단계; 및상기 모바일 단말 내에서 상기 제2 딥러닝 모델을 이용하여 추론을 수행하는 단계를 포함하고,상기 제1 딥러닝 모델을 제2 딥러닝 모델로 경량화하는 단계는,상기 제1 딥러닝 모델에 관한 리소스 정보를 추정하는 단계;상기 모바일 단말에 관한 리소스 정보 및 상기 제1 딥러닝 모델에 관한 리소스 정보를 참조하여 상기 할당 가능 리소스를 결정하는 단계;상기 제1 딥러닝 모델에 관한 리소스 정보에 포함되는 소정의 제1 값들과 상기 모바일 단말에 관한 리소스 정보에 포함되는 소정의 제2 값들의 비율 중 최소 비율과 연관된 목표 경량화 비율을 결정하는 단계; 및상기 목표 경량화 비율에 기초하여 상기 제1 딥러닝 모델에 포함된 레이어의 수를 조절하는 단계를 더 포함하는 동적 리소스 적응형 딥러닝 모델 추론 방법을 프로세서가 수행하도록 하기 위한 명령어를 포함하는컴퓨터 프로그램.