보로노이 셀 기반의 서포트 클러스터링 장치 및 방법
DEVICE AND METHOD FOR VORONOI CELL-BASED SUPPORT CLUSTERING
특허 요약
본 발명은 데이터 저장소에 저장되어 있는 데이터 집합에서 샘플 데이터를 추출하고, 상기 추출된 샘플 데이터로부터 각 클러스터를 정의하는 클러스터링 정의부; 및 상기 데이터 집합의 각 데이터를 상기 정의된 각 클러스터 중 하나로 할당하는 클러스터링 할당부;를 포함하되, 상기 클러스터링 정의부는 보로노이 셀(Voronoi cell)의 시드(seed)로 사용할 수 있는 대표점을 산출하여, 상기 대표점을 라벨링(labelling)함으로써 상기 각 클러스터를 정의하는 클러스터링 장치를 제공한다.
청구항
번호청구항
4

제 1 항에 있어서,상기 클러스터링 정의부는 상기 샘플 데이터로부터 서포트(support) 함수를 산출하고, 상기 서포트 함수를 사용하여 상기 대표점을 산출하는 클러스터링 장치.

5

제 1 항에 있어서,상기 클러스터링 정의부는 상기 대표점을 이용하여 가중 그래프를 구축하고, 상기 가중 그래프에서 임계값 이하의 가중치를 가지는 간선을 삭제하여 부분 그래프로 분할하여, 상기 분할된 각 부분 그래프가 상기 각 클러스터에 포함되도록 상기 각 클러스터를 정의하는 클러스터링 장치.

1

클러스터링 장치에 있어서,데이터 저장소에 저장되어 있는 데이터 집합에서 샘플 데이터를 추출하고, 상기 추출된 샘플 데이터로부터 각 클러스터를 정의하고, 상기 각 클러스터의 대표점을 산출하여 라벨링(labelling)하는 클러스터링 정의부; 및상기 데이터 집합의 각 데이터에서 가장 가까운 클러스터의 대표점과의 거리 및 다음으로 가까운 클러스터의 대표점과의 거리를 산출하고, 상기 산출된 가까운 대표점과의 거리 및 상기 산출된 다음으로 가까운 대표점과의 거리에 대한 비율에 기초하여, 상기 각 데이터를 상기 정의된 각 클러스터 중 하나로 할당하는 클러스터링 할당부;를 포함하되,상기 대표점은 보로노이 셀(Voronoi cell)의 시드(seed)로 사용하기 위하여 산출되는 것인 클러스터링 장치.

2

제 1 항에 있어서,상기 클러스터링 할당부는 상기 비율이 임계값 이하일 때, 상기 데이터를 상기 가장 가까운 대표점의 클러스터로 할당하는 클러스터링 장치.

3

제 1 항에 있어서,상기 클러스터링 할당부는 상기 비율이 임계값 이상일 때, 동적 시스템(dynamical system)을 이용하여 대상 대표점을 산출하고 상기 데이터를 상기 산출한 대상 대표점의 클러스터로 할당하는 클러스터링 장치.

6

클러스터링 장치를 사용하는 클러스터링 방법에 있어서,데이터 저장소에 저장되어 있는 데이터 집합에서 샘플 데이터를 추출하고, 상기 추출된 샘플 데이터로부터 각 클러스터를 정의하고, 상기 각 클러스터의 대표점을 산출하여 라벨링(labelling)하는 클러스터링 정의 단계; 및상기 데이터 집합의 각 데이터에서 가장 가까운 클러스터의 대표점과의 거리 및 다음으로 가까운 클러스터의 대표점과의 거리를 산출하고, 상기 산출된 가까운 대표점과의 거리 및 상기 산출된 다음으로 가까운 대표점과의 거리의 비율에 기초하여, 상기 데이터 집합의 각 데이터를 상기 정의된 각 클러스터 중 하나로 할당하는 클러스터링 할당 단계를 포함하되,상기 대표점은 보로노이 셀(Voronoi cell)의 시드(seed)로 사용하기 위하여 산출되는 것인 클러스터링 방법.

7

제 6 항에 있어서,상기 클러스터링 할당 단계는 상기 비율이 임계값 이하일 때, 상기 데이터를 상기 가장 가까운 대표점의 클러스터로 할당하는 클러스터링 방법.

8

제 6 항에 있어서,상기 클러스터링 할당 단계는 상기 비율이 임계값 이상일 때, 동적 시스템(dynamical system)을 이용하여 대상 대표점을 산출하고 상기 데이터를 상기 산출한 대상 대표점의 클러스터로 할당하는 클러스터링 방법.

9

제 6 항에 있어서,상기 클러스터링 정의 단계는 상기 샘플 데이터로부터 서포트(support) 함수를 산출하고, 상기 서포트 함수를 사용하여 상기 대표점을 산출하는 클러스터링 방법.

10

제 6 항에 있어서,상기 클러스터링 정의 단계는 상기 대표점을 이용하여 가중 그래프를 구축하고, 상기 가중 그래프에서 임계값 이하의 가중치를 가지는 간선을 삭제하여 부분 그래프로 분할하여, 상기 분할된 각 부분 그래프가 상기 각 클러스터에 포함되도록 상기 각 클러스터를 정의하는 클러스터링 방법.