프로퍼티 그래프 데이터 저장 방법 및 이를 위한 저장 장치
Method for storing property graph data and storage device for the same
특허 요약
프로퍼티 그래프 데이터를 저장하는 하부 스토리지, 및 상기 프로퍼티 그래프 데이터가 상기 하부 스토리지에 저장되는 과정에 관여하는 데이터 로더를 포함하고, 상기 데이터 로더는, 상기 프로퍼티 그래프 데이터의 스키마를 추출하고, 상기 프로퍼티 그래프 데이터의 추출된 스키마와의 유사도 값에 기반하여 상기 하부 스토리지 내에 논리적으로 생성된 클러스터 중 하나에 상기 프로퍼티 그래프 데이터를 저장하며, 상기 프로퍼티 그래프 데이터는 클러스터 별로 반환되는, 프로퍼티 그래프 데이터 저장 장치를 공개한다.
청구항
번호청구항
13

제11항에 있어서, 상기 저장하는 단계는, 상기 유사도 값이 임계값 이상인 클러스터가 있는 경우 상기 프로퍼티 그래프 데이터를 상기 임계값 이상인 클러스터에 저장하는 단계이거나,상기 유사도 값이 상기 임계값 이상인 클러스터가 없는 경우 새로운 클러스터를 설정하여 상기 프로퍼티 그래프 데이터를 상기 새로운 클러스터에 저장하는 단계인, 프로퍼티 그래프 데이터 저장 방법.

1

프로퍼티 그래프 데이터를 저장하는 하부 스토리지; 및 상기 프로퍼티 그래프 데이터가 상기 하부 스토리지에 저장되는 과정에 관여하는 데이터 로더; 를 포함하고,상기 데이터 로더는,상기 프로퍼티 그래프 데이터의 스키마를 추출하고,상기 프로퍼티 그래프 데이터의 추출된 스키마와의 유사도 값에 기반하여 상기 하부 스토리지 내에 논리적으로 생성된 클러스터 중 하나에 상기 프로퍼티 그래프 데이터를 저장하며,상기 프로퍼티 그래프 데이터는 클러스터 별로 반환되며,상기 클러스터는 하나 이상의 열 기반 저장소를 포함하며, 상기 열 기반 저장소는 상기 프로퍼티 그래프 데이터의 속성에 따라 생성되며, 상기 프로퍼티 그래프 데이터는 속성 별로 분리되며, 상기 프로퍼티 그래프 데이터의 속성에 대한 값은 매칭되는 속성의 열 기반 저장소에 저장되는,프로퍼티 그래프 데이터 저장 장치.

2

제1항에 있어서, 상기 클러스터는 새로 생성된 클러스터이거나 기 생성된 클러스터인, 프로퍼티 그래프 데이터 저장 장치.

3

제1항에 있어서, 상기 데이터 로더는, 상기 유사도 값이 임계값 이상인 클러스터가 있는 경우 상기 프로퍼티 그래프 데이터를 상기 임계값 이상인 클러스터에 저장하고, 상기 유사도 값이 상기 임계값 이상인 클러스터가 없는 경우 새로운 클러스터를 설정하여 상기 프로퍼티 그래프 데이터를 상기 새로운 클러스터에 저장하는, 프로퍼티 그래프 데이터 저장 장치.

4

제3항에 있어서, 상기 데이터 로더는, 상기 유사도 값이 상기 임계값 이상인 클러스터들이 여러 개인 경우, 상기 클러스터들 중 상기 유사도 값이 가장 큰 클러스터에 상기 프로퍼티 그래프 데이터를 저장하는, 프로퍼티 그래프 데이터 저장 장치.

5

제4항에 있어서, 상기 유사도 값이 상기 임계값 이상인 클러스터들 중 상기 유사도 값이 가장 큰 클러스터 내에 포함되는 속성의 개수가 가장 적은 제1 스키마의 속성의 개수와 상기 프로퍼티 그래프 데이터의 스키마의 속성의 개수 간의 차가 제2 임계값 이상인 경우, 상기 데이터 로더는 상기 프로퍼티 그래프 데이터를 상기 유사도 값이 가장 큰 클러스터가 아닌 다른 클러스터에 저장하는,프로퍼티 그래프 데이터 저장 장치.

6

제1항에 있어서, 두 개 이상의 프로퍼티 그래프들이 서로 다른 스키마를 갖는 경우에 임의의 클러스터에 함께 저장되는 경우, 상기 저장된 두 개 이상의 프로퍼티 그래프들은 상기 임의의 클러스터 내의 모든 스키마들이 통합된 통합 스키마를 갖는 것으로 설정되는, 프로퍼티 그래프 데이터 저장 장치.

7

삭제

8

제1항에 있어서, 상기 프로퍼티 그래프 데이터는 복수 개의 정점들 및 간선들 중 적어도 하나 이상을 포함하며, 상기 데이터 로더는 상기 프로퍼티 그래프 데이터에 포함된 정점 및 간선 별로 튜플들을 분리한 후 상기 튜플마다 스키마를 추출하고, 상기 데이터 로더는 상기 튜플을 상기 튜플에 포함된 속성 별로 분리하여 분리된 속성에 대한 값을 매칭되는 속성의 열 기반 저장소에 저장하는, 프로퍼티 그래프 데이터 저장 장치.

9

제1항에 있어서, 상기 데이터 로더가 저장되어 있는 프로퍼티 그래프 데이터 중 임의의 튜플의 속성에 대한 값을 변경하려고 하는 경우, 상기 임의의 튜플이 위치한 클러스터의 열 기반 저장소의 속성에 대한 값을 변경하는, 프로퍼티 그래프 데이터 저장 장치.

10

제3항에 있어서, 상기 데이터 로더가 이미 저장되어 있는 프로퍼티 그래프 데이터 중 임의의 튜플의 속성에 대한 값과 상기 값의 데이터 타입을 변경하려고 하는 경우, 상기 임의의 튜플의 스키마와의 유사도 값이 상기 임계값 이상인 스키마를 갖는 클러스터를 결정하여 상기 결정된 클러스터에 저장하는, 프로퍼티 그래프 데이터 저장 장치.

11

데이터 로더가, 프로퍼티 그래프 데이터의 저장 요청을 수신하는 경우, 상기 프로퍼티 그래프 데이터의 스키마를 추출하는 단계;상기 데이터 로더가, 상기 프로퍼티 그래프의 추출된 스키마와의 유사도 값을 계산하는 단계; 및상기 데이터 로더가, 상기 유사도 값에 기반하여 하부 스토리지 내에 논리적으로 생성된 클러스터 중 하나에 상기 프로퍼티 그래프 데이터를 저장하는 단계;를 포함하며,상기 프로퍼티 그래프 데이터는 클러스터 별로 반환되며,상기 클러스터는 하나 이상의 열 기반 저장소를 포함하며, 상기 열 기반 저장소는 상기 프로퍼티 그래프 데이터의 속성에 따라 생성되며,상기 저장하는 단계는, 상기 프로퍼티 그래프 데이터를 속성 별로 분리하는 단계; 및상기 분리된 속성에 대한 값을 매칭되는 속성의 열 기반 저장소에 저장하는 단계; 를 포함하는,프로퍼티 그래프 데이터 저장 방법.

12

제11항에 있어서, 상기 클러스터는 새로 생성된 클러스터이거나 기 생성된 클러스터인, 프로퍼티 그래프 데이터 저장 방법.

14

제13항에 있어서, 상기 저장하는 단계는, 상기 유사도 값이 상기 임계값 이상인 클러스터들이 여러 개인 경우, 상기 클러스터들 중 상기 유사도 값이 가장 큰 클러스터에 상기 프로퍼티 그래프 데이터를 저장하는 단계인, 프로퍼티 그래프 데이터 저장 방법.

15

제14항에 있어서, 상기 저장하는 단계는, 상기 유사도 값이 가장 큰 클러스터 내에 포함되는 속성의 개수가 가장 적은 제1 스키마의 속성의 개수와 상기 프로퍼티 그래프 데이터의 스키마의 속성의 개수 간의 차가 제2 임계값 이상인지 판정하는 단계; 및 상기 차가 상기 제2 임계값 이상인 경우, 상기 프로퍼티 그래프 데이터를 상기 유사도 값이 가장 큰 클러스터가 아닌 다른 클러스터에 저장하는 단계;를 포함하는,프로퍼티 그래프 데이터 저장 방법.

16

제11항에 있어서, 두 개 이상의 프로퍼티 그래프들이 서로 다른 스키마를 갖는 경우에 임의의 클러스터에 함께 저장되는 경우, 상기 저장된 두 개 이상의 프로퍼티 그래프들은 상기 임의의 클러스터 내의 모든 스키마들이 통합된 통합 스키마를 갖는 것으로 설정되는, 프로퍼티 그래프 데이터 저장 방법.

17

삭제

18

제11항에 있어서, 상기 스키마를 추출하는 단계는, 상기 프로퍼티 그래프 데이터를 하나 이상의 튜플로 분리하는 단계; 및상기 튜플에 대한 스키마를 추출하는 단계;를 포함하며, 상기 프로퍼티 그래프 데이터를 상기 유사성에 관한 값이 가장 큰 클러스터에 저장하는 단계는, 상기 프로퍼티 그래프의 데이터에 포함된 튜플을 상기 튜플에 포함된 속성 별로 분리하는 단계; 및상기 분리된 속성에 대한 값을 매칭되는 속성의 열 기반 저장소에 저장하는 단계;를 포함하는, 프로퍼티 그래프 데이터 저장 방법.

19

제11항에 있어서, 이미 저장되어 있는 프로퍼티 그래프 데이터 중 임의의 튜플의 속성에 대한 값을 변경하는 단계는, 상기 데이터 로더가 상기 임의의 튜플이 위치한 클러스터의 열 기반 저장소의 속성에 대한 값을 변경하는 단계인, 프로퍼티 그래프 데이터 저장 방법.

20

제13항에 있어서, 이미 저장되어 있는 프로퍼티 그래프 데이터 중 임의의 튜플의 속성에 대한 값과 상기 값의 데이터 타입을 변경하는 단계는, 상기 데이터 로더가, 상기 임의의 튜플의 스키마와의 유사도 값이 상기 임계값 이상인 스키마를 갖는 클러스터를 결정하는 단계; 및 상기 데이터 로더가, 상기 임의의 튜플을 상기 결정된 클러스터에 저장하는 단계를 포함하는, 프로퍼티 그래프 데이터 저장 방법.