정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 방법
INCREMENTAL HIGH UTILITY PATTERN MINING METHOD WITH STATIC AND DYNAMIC DATABASES
특허 요약
정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 방법은 초기 정적 데이터베이스에 대한 트리 자료구조를 구축하는 단계, 상기 정적 데이터베이스의 트랜잭션들을 빈도수 및 최대 아이템 수량 정보와 함께 상기 트리 자료구조에 저장하고 기 설정된 최적의 정렬순서에 따라 감소된 과추정 유틸리티를 계산하여 자료구조를 재 구축하는 단계, 상기 초기 정적 데이터베이스에 동적 데이터베이스가 추가되면 상기 동적 데이터베이스에 대한 트리 자료구조를 갱신하는 단계, 및 사용자에 의한 마이닝 요청이 발생되면 상기 정적 데이터베이스 또는 상기 동적 데이터베이스에서 구축 또는 갱신된 자료구조에서 기 설정된 유틸리티 임계치를 만족하는 모든 하이 유틸리티 패턴들을 마이닝하는 단계를 포함한다. 따라서, 정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 방법은 초기 정적 데이터베이스뿐만 아니라 추후 점진적으로 증가된 동적 데이터베이스까지 고려하여 하이 유틸리티 패턴들을 효율적으로 마이닝 할 수 있다.
청구항
번호청구항
2

제1항에 있어서, 상기 (a) 단계는 (a1) 상기 초기 정적 데이터베이스로부터 상기 트랜잭션들을 하나씩 읽어오는 단계;(a2) 해당 트랜잭션 아이템들을 정렬하는 단계; 및(a3) 상기 정렬된 트랜잭션 아이템들을 트리 자료구조에 삽입하는 단계를 포함하는 것을 특징으로 하는 정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 방법.

1

HUPID(High Utility Patterns in Incremental Databases)-Growth 알고리즘을 적용한 정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 방법에 있어서,(a) 초기 정적 데이터베이스에 대한 트리 자료구조를 구축하는 단계;(b) 상기 정적 데이터베이스의 트랜잭션들을 빈도수 및 최대 아이템 수량 정보와 함께 상기 트리 자료구조에 저장하고 기 설정된 최적의 정렬순서에 따라 감소된 과추정 유틸리티를 계산하여 자료구조를 재 구축하는 단계;(c) 상기 초기 정적 데이터베이스에 동적 데이터베이스가 동적으로 추가되면 추가된 해당 데이터만을 스캔하고 상기 정적 데이터베이스에서 기 구축한 상기 자료구조에 반영하여 상기 동적 데이터베이스에 대한 트리 자료구조를 갱신하는 단계; 및(d) 사용자에 의한 마이닝 요청이 발생되면 상기 정적 데이터베이스 또는 상기 동적 데이터베이스에서 구축 또는 갱신된 자료구조에서 기 설정된 유틸리티 임계치를 만족하는 모든 하이 유틸리티 패턴들을 마이닝하는 단계를 포함하고,상기 (d) 단계는(d1) 임시 자료구조(TmpTIList)을 생성하는 단계;(d2) 테일 노드 정보 목록(TIList)의 각 엔트리를 시작으로 상기 트리 자료구조로부터 경로를 추출하는 단계;(d3) 기 설정된 정렬순서에 따라 재정렬하고 기 설정된 임계값 이상으로 감소된 과추정 유틸리티를 계산하는 단계;(d4) 재정렬된 경로를 해당 트리 자료구조에 다시 삽입하는 단계를 포함하는 정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 방법.

3

제2항에 있어서, 상기 (a) 단계는 (a4) 각 아이템 정보를 헤더 테이블에 트랜잭션 유틸리티를 기준으로 갱신하는 단계;(a5) 상기 정렬된 트랜잭션 내 마지막 아이템에 대한 노드를 테일 노드 정보 목록(TIList) 내 엔트리와 연결하고 해당 엔트리의 빈도수 및 유틸리티 정보를 각각 1 및 상기 트랜잭션 유틸리티만큼 증가하여 갱신하는 단계;(a6) 최소 아이템 유틸리티 테이블의 각 삽입 아이템에 대하여 상기 정적 데이터베이스 내 가장 작은 아이템 유틸리티 값 정보를 유지하도록 기 저장된 아이템 유틸리티 값과 현재 삽입되는 아이템 유틸리티 값 중에서 작은 값으로 갱신하는 단계; 및(a7) 트리 자료구조 생성하는 단계를 더 포함하는 것을 특징으로 하는 정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 방법.

4

제2항에 있어서, 상기 (a2) 단계는 (a21) 해당 트랜잭션 아이템들을 초기 정렬순서에 따라 정렬하는 단계를 더 포함하는 것을 특징으로 하는 정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 방법.

5

제1항에 있어서, 상기 (c) 단계는 (c1) 새롭게 추가된 데이터로부터 트랜잭션을 하나씩 읽어오는 단계;(c2) 현재 정렬순서에 따라 상기 트랜잭션 내 아이템들을 정렬하는 단계; 및(c3) 상기 정렬된 트랜잭션 아이템들을 트리 자료구조에 삽입하는 단계를 포함하는 것을 특징으로 하는 정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 방법.

6

제5항에 있어서, 상기 (c) 단계는 (c4) 각 아이템 정보를 헤더 테이블에 트랜잭션 유틸리티를 기준으로 기 구축된 자료구조를 갱신하는 단계;(c5) 상기 정렬된 트랜잭션 내 마지막 아이템에 대한 노드를 테일 노드 정보 목록(TIList) 내 엔트리와 연결하고 해당 엔트리의 빈도수 및 유틸리티 정보를 각각 1 및 상기 트랜잭션 유틸리티만큼 증가하여 갱신하는 단계;(c6) 최소 아이템 유틸리티 테이블의 각 삽입 아이템에 대하여 상기 동적 데이터베이스 내 가장 작은 아이템 유틸리티 값 정보를 유지하도록 기 저장된 아이템 유틸리티 값과 현재 삽입되는 아이템 유틸리티 값 중에서 작은 값으로 갱신하는 단계; 및(c7) 트리 자료구조 생성하는 단계를 더 포함하는 것을 특징으로 하는 정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 방법.

7

제5항에 있어서, 상기 (c2) 단계는 (c21) 상기 트리 자료구조의 헤더 테이블에 저장된 정보를 이용하여 과추정 유틸리티 내림차순으로 정렬하는 단계를 더 포함하는 것을 특징으로 하는 정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 방법.

8

삭제

9

제1항에 있어서, 상기 (d) 단계는 (d5) 해당 경로의 마지막 아이템에 대한 노드 정보를 상기 임시 자료구조에 추가하는 단계;(d6) 모든 경로에 대한 처리가 완료되면 원본 테일 노드 정보 목록을 제거하는 단계; 및(d7) 상기 임시 자료구조가 새로운 테일 노드 정보 목록으로 생성되는 단계를 더 포함하는 정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 방법.

10

HUPID(High Utility Patterns in Incremental Databases)-Growth 알고리즘을 적용한 정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 장치에 있어서,정적 데이터베이스 또는 동적 데이터베이스로부터 입력받은 데이터를 스캔하고 상기 정적 데이터베이스 또는 상기 동적 데이터베이스 내의 트랜잭션을 읽어오는 트랜잭션 스캔부;상기 정적 데이터베이스 또는 상기 동적 데이터베이스의 해당 트랜잭션 아이템들을 정렬하고 이를 트리 자료구조에 삽입하는 트랜잭션 삽입부;상기 정적 데이터베이스 또는 상기 동적 데이터베이스에 대한 트리 기반의 자료구조를 구축하는 트리 자료구조 모듈;사용자의 요청에 의해 상기 구축된 자료구조로부터 주어진 기 설정된 최소 유틸리티 임계치를 만족하는 모든 하이 유틸리티 패턴들을 마이닝하는 패턴 마이닝부; 및상기 패턴 마이닝부에서 마이닝된 하이 유틸리티 패턴들이 기 설정된 기준에 의해 정상적으로 마이닝되었는지 여부를 확인하고, 상기 마이닝된 하이 유틸리티 패턴들을 사용자의 요청에 따라 기 설정된 분류별로 구분하여 디스플레이 기기로 출력하거나 다시 상기 패턴 마이닝부에서 하이 유틸리티 패턴들을 재 마이닝하도록 제어하는 하이 유틸리티 패턴부를 포함하고,상기 트리 자료구조 모듈은상기 정적 데이터베이스로부터 입력받은 데이터에 대해 트리 기반의 자료구조를 구축하는 트리 자료구조 구축부;상기 동적 데이터베이스로부터 입력받은 데이터만을 스캔하고 상기 트리 자료구조 구축부에서 구축된 자료구조에 반영하여 트리 자료구조로 갱신하는 트리 자료구조 갱신부;상기 트리 자료구조 구축부에서 구축된 자료구조를 재 구축하거나 상기 트리 자료구조 갱신부에서 갱신된 자료구조를 재 구축하는 자료구조 재 구축부를 포함하는 정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 장치.

11

삭제

12

제10항에 있어서, 상기 트리 자료구조는각 아이템의 과추정 유틸리티(TWU) 정보를 저장하는 헤더 테이블;트리;테일 노드의 빈도수 및 트랜잭션 유틸리티 정보를 저장하는 테일 노드 목록 정보(TIList); 및상기 트리 자료구조에 삽입되는 해당 트랜잭션 아이템에 대하여 상기 정적 데이터베이스 또는 상기 동적 데이터베이스 내 가장 작은 트랜잭션 아이템 유틸리티 값 정보를 유지하는 최소 아이템 유틸리티 테이블을 포함하는 것을 특징으로 하는 정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 장치.

13

제10항에 있어서, 상기 재 구축부는상기 정적 데이터베이스의 트랜잭션들을 빈도수 및 최대 아이템 수량 정보와 함께 상기 트리 자료구조에 저장하고 기 설정된 최적의 정렬순서에 따라 감소된 과추정 유틸리티를 계산하여 자료구조를 재 구축하는 것을 특징으로 하는 정적 및 동적 데이터베이스에 대한 점진적 하이 유틸리티 패턴 마이닝 장치.