바이너리 파일 고정화와 웨이블릿 신호처리를 통한 바이너리 파일 특징 정보 추출
BINARY FILE FEATURE EXTRACTION WITH FIXED-SIZE DATA AND WAVELET SIGNAL PROCESSING
특허 요약
본 개시의 몇몇 실시예에 따른, 적어도 하나의 프로세서를 포함하는 컴퓨팅 장치에 의해 수행되는 파일 특징 정보를 추출하는 방법이 개시된다. 상기 파일 특징 정보를 추출하는 방법은 바이너리(binary) 파일 형태의 입력 데이터를 기 설정된 크기의 데이터로 변환하는 단계; 및 상기 기 설정된 크기의 데이터로부터 상기 입력 데이터의 특징 정보를 추출하는 단계를 포함할 수 있다.
청구항
번호청구항
1

적어도 하나의 프로세서를 포함하는 컴퓨팅 장치에 의해 수행되는 파일 특징 정보를 추출하는 방법으로서,바이너리(binary) 파일 형태의 입력 데이터를 기 설정된 크기의 데이터로 변환하는 단계;상기 기 설정된 크기의 데이터에 웨이블릿 변환(wavelet transform)을 수행하여, 웨이블릿 계수 행렬을 추출하는 단계 - 상기 웨이블릿 계수 행렬은 근사 계수 행렬(approximation coefficients matrix) 및 상세 계수 행렬(detail coefficients matrix)을 포함함 -; 및상기 웨이블릿 계수 행렬에 기초하여, 상기 입력 데이터의 특징 정보를 추출하는 단계;를 포함하는,파일 특징 정보를 추출하는 방법.

2

제 1 항에 있어서,상기 바이너리(binary) 파일 형태의 입력 데이터를 기 설정된 크기의 데이터로 변환하는 단계는,히든 마르코프 모델(hidden Markov model)을 이용하여, 상기 입력 데이터를 상기 기 설정된 크기의 데이터로 변환하는 단계;를 포함하는,파일 특징 정보를 추출하는 방법.

3

제 1 항에 있어서,상기 바이너리(binary) 파일 형태의 입력 데이터를 기 설정된 크기의 데이터로 변환하는 단계는,상기 입력 데이터를 기억장치의 크기를 나타내는 제 1 단위(unit)로 구분하여 인식하는 단계;상기 제 1 단위로 인식된 데이터의 개수를 카운팅하는 단계; 및상기 제 1 단위의 데이터의 개수에 기초하여, 상기 입력 데이터를 상기 기 설정된 크기의 데이터로 변환하는 단계;를 포함하는,파일 특징 정보를 추출하는 방법.

4

제 1 항에 있어서,상기 바이너리(binary) 파일 형태의 입력 데이터를 기 설정된 크기의 데이터로 변환하는 단계는,상기 입력 데이터를 바이트 단위로 인식하는 단계;인식된 복수의 바이트들 각각의 개수를 카운팅하는 단계; 및상기 복수의 바이트들 각각의 개수에 기초하여, 상기 입력 데이터를 상기 기 설정된 크기의 데이터로 변환하는 단계;를 포함하는,파일 특징 정보를 추출하는 방법.

5

제 4 항에 있어서,상기 복수의 바이트들 각각의 개수에 기초하여, 상기 입력 데이터를 상기 기 설정된 크기의 데이터로 변환하는 단계는,상기 복수의 바이트들 각각의 개수에 기초하여, 전체 데이터 중 상기 복수의 바이트들 각각의 출현 확률을 계산하는 단계; 및상기 출현 확률에 기초하여, 상기 입력 데이터를 상기 기 설정된 크기의 데이터로 변환하는 단계;를 포함하는,파일 특징 정보를 추출하는 방법.

6

제 1 항에 있어서,상기 바이너리(binary) 파일 형태의 입력 데이터를 기 설정된 크기의 데이터로 변환하는 단계는,상기 입력 데이터를 바이트 단위로 인식하는 단계;인식된 복수의 바이트들 중에서 제 1 바이트 다음에 제 2 바이트가 연결되는, 바이트들 간의 고유 연결 구조의 출현 횟수를 계산하는 단계 - 상기 출현 횟수는 상기 인식된 복수의 바이트들 중 적어도 일부에 대해 계산됨 -; 및상기 출현 횟수에 기초하여, 상기 입력 데이터를 상기 기 설정된 크기의 데이터로 변환하는 단계;를 포함하는,파일 특징 정보를 추출하는 방법.

7

제 6 항에 있어서,상기 출현 횟수에 기초하여, 상기 입력 데이터를 상기 기 설정된 크기의 데이터로 변환하는 단계는,상기 출현 횟수에 기초하여, 상기 제 1 바이트 다음에 상기 제 2 바이트가 출현되는, 바이트들 간의 연결 확률을 계산하는 단계; 및상기 연결 확률에 기초하여, 상기 입력 데이터를 상기 기 설정된 크기의 데이터로 변환하는 단계;를 포함하는,파일 특징 정보를 추출하는 방법.

8

삭제

9

삭제

10

제 1 항에 있어서,상기 상세 계수 행렬은,수평 계수 행렬(horizontal coefficients matrix), 수직 계수 행렬(vertical coefficients matrix) 또는 대각선 계수 행렬(diagonal coefficients matrix) 중 적어도 하나를 포함하는,파일 특징 정보를 추출하는 방법.

11

제 10 항에 있어서,상기 기 설정된 크기의 데이터는 행렬 구조를 갖는 데이터이고,상기 특징 정보는,상기 기 설정된 크기의 데이터가 1x1 행렬 구조가 되도록 제 1 횟수의 웨이블릿 변환을 수행하여 추출되는 상기 근사 계수 행렬과 관련된 제 1 특징, 제 1 임계 횟수 이상이고 그리고 상기 제 1 횟수 이하의 제 1 개수 범위 내에서의 제 2 횟수의 웨이블릿 변환을 수행하여 추출되는 상기 대각선 계수 행렬 값에 대한 제 2 특징, 제 1 임계 횟수 이상이고 그리고 상기 제 1 횟수 미만의 제 2 개수 범위 내에서의 제 3 횟수의 웨이블릿 변환을 수행하여 추출되는 상기 대각선 계수 행렬과 관련된 제 3 특징, 또는 상기 제 1 임계 횟수 미만의 제 2 임계 횟수 이상이고 그리고 상기 제 1 횟수 미만의 제 3 개수 범위 내에서의 제 4 횟수의 웨이블릿 변환을 수행하여 추출되는 상기 대각선 계수 행렬과 관련된 제 4 특징 중 적어도 하나를 포함하며, 여기서 상기 제 1 임계 횟수는 상기 제 1 횟수보다 작은,파일 특징 정보를 추출하는 방법.

12

제 11 항에 있어서,상기 제 3 특징은,상기 제 3 횟수의 웨이블릿 변환을 수행하여 추출되는 상기 대각선 계수 행렬의 비율과 관련된 제 3-1 특징 또는 상기 제 3 횟수의 웨이블릿 변환을 수행하여 추출되는 상기 대각선 계수 행렬의 제 1 표준편차와 관련된 제 3-2 특징 중 적어도 하나를 포함하는,파일 특징 정보를 추출하는 방법.

13

제 11 항에 있어서,상기 제 4 특징은,상기 제 4 횟수의 웨이블릿 변환을 수행하여 추출되는 상기 대각선 계수 행렬의 값의 합 관련된 제 4-1 특징, 상기 제 3 횟수의 웨이블릿 변환을 수행하여 추출되는 상기 대각선 계수 행렬의 값의 비대칭도와 관련된 제 4-2 특징, 상기 제 3 횟수의 웨이블릿 변환을 수행하여 추출되는 상기 대각선 계수 행렬의 제 2 표준편차와 관련된 제 4-3 특징 또는 상기 제 3 횟수의 웨이블릿 변환을 수행하여 추출되는 상기 대각선 계수 행렬의 평균 값과 관련된 제 4-4 특징 중 적어도 하나의 특징을 포함하는,파일 특징 정보를 추출하는 방법.

14

제 1 항에 있어서,바이너리 파일 형태의 입력 데이터로부터 악성 코드를 탐지하도록 상기 특징 정보를 학습 데이터로 이용하여 네트워크 모델을 학습시키는 단계;를 더 포함하는,파일 특징 정보를 추출하는 방법.

15

파일 특징 정보를 추출하는 컴퓨팅 장치로서,바이너리(binary) 파일 형태의 입력 데이터를 기 설정된 크기의 데이터로 변환하는 바이너리 파일 변환부; 및상기 기 설정된 크기의 데이터에 웨이블릿 변환(wavelet transform)을 수행하여, 웨이블릿 계수 행렬을 추출하고, 그리고 상기 웨이블릿 계수 행렬에 기초하여, 상기 입력 데이터의 특징 정보를 추출하는 신호처리부;를 포함하고,상기 웨이블릿 계수 행렬은 근사 계수 행렬(approximation coefficients matrix) 및 상세 계수 행렬(detail coefficients matrix)을 포함하는,컴퓨팅 장치.

16

컴퓨터 판독가능 저장 매체에 저장되는 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 하나 이상의 프로세서에 의해 실행되는 경우 파일의 특징 정보를 추출하는 방법을 수행하며, 상기 방법은바이너리(binary) 파일 형태의 입력 데이터를 기 설정된 크기의 데이터로 변환하는 단계;상기 기 설정된 크기의 데이터에 웨이블릿 변환(wavelet transform)을 수행하여, 웨이블릿 계수 행렬을 추출하는 단계 - 상기 웨이블릿 계수 행렬은 근사 계수 행렬(approximation coefficients matrix) 및 상세 계수 행렬(detail coefficients matrix)을 포함함 -; 및상기 웨이블릿 계수 행렬에 기초하여, 상기 입력 데이터의 특징 정보를 추출하는 단계;를 포함하는,컴퓨터 판독가능 저장 매체에 저장되는 컴퓨터 프로그램.