로그 데이터의 이상 탐지 방법 및 그 장치
METHOD AND APPARATUS FOR DETECTING ANOMALIES IN LOG DATA
특허 요약
아래의 개시는 로그 데이터 이상 탐지 방법에 관한 것으로, 데이터 베이스(Database)로부터 로그 데이터(log data)들를 수집하여, 로그 데이터(log data) 매니저를 통해 로그 데이터들을 시간 축으로 가공하여 제1 로그 데이터를 획득하는 동작, 트랜스포머(Transformer)를 통해 제1 로그 데이터를 제2 로그 데이터로 재구성하는 동작, 상기 제1 로그 데이터와 제2 로그 데이터 간의 차이에 기초하여, 트랜스포머를 통해 시간 지점들 각각의 이상치 점수(Anomaly score)를 계산하는 동작 및 이상치 점수에 기초하여, 이상 탐지기(Anomaly Detector)를 통해 각 시간 지점 별 이상 여부를 탐지하는 동작을 포함할 수 있다.
청구항
번호청구항
3

제1항에 있어서,통계적 방법을 사용하여, 이상치 점수 통합기를 통해 상기 이상치 점수를 보정하는 방법을 더 포함하는, 로그 데이터의 이상 탐지 방법.

4

제3항에 있어서,상기 이상치 점수 통합기는상기 제1 로그 데이터의 주요 특징을 추출하기 위해 주성분 분석을 사용하여 상기 제1 로그 데이터의 차원을 주요 차원으로 감축하는, 로그 데이터의 이상 탐지 방법.

1

데이터 베이스(Database)로부터 로그 데이터(log data)들를 수집하여, 로그 데이터(log data) 매니저를 통해 상기 로그 데이터들을 시간 축으로 가공하여 제1 로그 데이터를 획득하는 동작;트랜스포머(Transformer)를 통해 상기 제1 로그 데이터를 제2 로그 데이터로 재구성하는 동작;상기 제1 로그 데이터와 상기 제2 로그 데이터 간의 차이에 기초하여, 상기 트랜스포머를 통해 상기 시간 지점들 각각의 이상치 점수(Anomaly score)를 계산하는 동작; 및상기 이상치 점수에 기초하여, 이상 탐지기(Anomaly Detector)를 통해 각 시간 지점 별 이상 여부를 탐지하는 동작을 포함하는, 로그 데이터의 이상 탐지 방법.

2

제1항에 있어서,상기 시간 지점들 각각의 이상치 점수를 계산하는 동작은상기 이상치 점수를 각 시간 지점들 별로 수치화하는 동작을 포함하는, 로그 데이터의 이상 탐지 방법.

5

제4항에 있어서,상기 이상치 점수 통합기는상기 제1 로그 데이터의 주요 차원에 대해 평균과 공분산을 획득하여 mahalanobis 거리를 획득하고, 상기 mahalanobis 거리에 기초하여 상기 이상치 점수를 보정하는, 로그 데이터의 이상 탐지 방법.

6

제1항에 있어서,이상치 원인 분류기를 통해 상기 탐지된 이상치의 원인을 분류하는 동작을 더 포함하는, 로그 데이터의 이상 탐지 방법.

7

제1항에 있어서,상기 이상 여부를 탐지하는 동작은상기 로그 데이터의 특성에 따라 동적으로 임계값을 설정하는 동작; 및상기 임계값을 기준으로 이상 여부를 판단하는 동작을 포함하는, 로그 데이터의 이상 탐지 방법.

8

제7항에 있어서,상기 임계값을 설정하는 동작은가중치 파라미터, 주요 차원의 수 및 백분위수 중 적어도 하나를 조절하는 동작을 포함하는, 로그 데이터의 이상 탐지 방법.

9

제1항에 있어서,상기 트랜스포머는상기 제1 로그 데이터의 시간 지점들 각각에 대해, 각 시간 지점과 주변 시간 지점들 사이의 연관성을 파악하도록 학습된, 로그 데이터의 이상 탐지 방법.

10

제9항에 있어서,상기 트랜스포머는상기 연관성에 기초하여, 상기 제1 로그 데이터를 상기 제2 로그 데이터로 재구성할 수 있도록 학습된, 로그 데이터의 이상 탐지 방법.

11

제10항에 있어서,상기 트랜스포머는상기 시간 지점들 각각에서 상기 제1 로그 데이터와 상기 제2 로그 데이터 간의 차이 및 상기 제2 로그 데이터의 시간 지점들 각각에서의 주변 시간 지점들과의 연결 불일치(Association Discrepancy)에 기초하여, 이상치 점수를 계산하도록 학습된, 로그 데이터의 이상 탐지 방법.

12

하드웨어와 결합되어 제1항 내지 제11항 중 어느 하나의 항의 방법을 실행시키기 위하여 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램.

13

인스트럭션들을 저장하는 메모리; 및하나 이상의 프로세서를 포함하고,상기 인스트럭션들은 상기 하나 이상의 프로세서에 의해 실행될 때, 전자 장치로 하여금,데이터베이스(Database)로부터 로그 데이터(log data)들를 수집하여, 로그 데이터(log data) 매니저를 통해 상기 로그 데이터들을 시간 축으로 가공하여 제1 로그 데이터를 획득하고,상기 제1 로그 데이터의 시간 지점(time point)들 각각에 대해 각 시간 지점의 주변의 시간 지점들에 기초하여, 트랜스포머(Transformer)를 통해 상기 제1 로그 데이터를 제2 로그 데이터로 재구성하고,상기 제1 로그 데이터와 상기 제2 로그 데이터간의 차이에 기초하여, 상기 트랜스포머를 통해 상기 시간 지점들 각각의 이상치 점수(Anomaly score)를 계산하고,상기 이상치 점수에 기초하여, 이상 탐지기(Anomaly Detector)를 통해 각 시간 지점 별 이상 여부를 탐지하도록 하는, 전자 장치.

14

제13항에 있어서,상기 인스트럭션들은 상기 하나 이상의 프로세서에 의해 실행될 때, 상기 전자 장치로 하여금,상기 이상치 점수를 각 시간 지점들 별로 수치화하도록 하는, 전자 장치.

15

제13항에 있어서,상기 인스트럭션들은 상기 하나 이상의 프로세서에 의해 실행될 때, 상기 전자 장치로 하여금,통계적 방법을 사용하여, 이상치 점수 통합기를 통해 상기 이상치 점수를 보정하도록 하는, 전자 장치.

16

제15항에 있어서,상기 이상치 점수 통합기는상기 제1 로그 데이터의 주요 특징을 추출하기 위해 주성분 분석을 사용하여 상기 제1 로그 데이터의 차원을 주요 차원으로 감축하는, 전자 장치.

17

제16항에 있어서,상기 이상치 점수 통합기는상기 제1 로그 데이터의 주요 차원에 대해 평균과 공분산을 획득하여 mahalanobis 거리를 획득하고, 상기 mahalanobis 거리에 기초하여 상기 이상치 점수를 보정하는, 전자 장치.

18

제13항에 있어서,상기 인스트럭션들은 상기 하나 이상의 프로세서에 의해 실행될 때, 상기 전자 장치로 하여금,이상치 원인 분류기를 통해 상기 탐지된 이상치의 원인을 분류하도록 하는, 전자 장치.

19

제13항에 있어서,상기 인스트럭션들은 상기 하나 이상의 프로세서에 의해 실행될 때, 상기 전자 장치로 하여금,상기 로그 데이터의 특성에 따라 동적으로 임계값을 설정하고,상기 임계값을 기준으로 이상 여부를 판단하도록 하는, 전자 장치.

20

제19항에 있어서,상기 인스트럭션들은 상기 하나 이상의 프로세서에 의해 실행될 때, 상기 전자 장치로 하여금,가중치 파라미터, 주요 차원의 수 및 백분위수 중 적어도 하나를 조절하도록 하는, 전자 장치.