희귀 유전변이 다유전자 위험 점수 산출 방법 및 장치
METHOD AND DEVICE FOR CALCULATING RARE VARIANT POLYGENIC RISK SCORE
특허 요약
본 개시의 일 실시예는, 다유전자 위험 점수 산출 방법을 제공한다. 본 방법은, 기설정된 제1 알고리즘을 이용하여 개인의 유전체 데이터에 대한 표현형의 추정치를 산출하는 단계, 상기 유전체 데이터에 포함된 유전자별 희귀 유전변이를 특정 기준에 따라 복수개의 그룹으로 분류하고, 상기 복수개의 그룹별 유전자형 행렬과 상기 표현형의 추정치에 기초한 기설정된 제2 알고리즘을 이용하여 상기 희귀 유전변이의 효과 크기를 추정하는 단계 및 상기 복수개의 그룹별 유전자형 행렬과 상기 희귀 유전변이의 효과 크기에 기초한 기설정된 제3 알고리즘을 이용하여 상기 희귀 유전변이 다유전자 위험 점수를 산출하는 단계를 포함한다.
청구항
번호청구항
12

제11항에 있어서, 상기 유전체 데이터는 개인 고유 번호, 연령, 성별, 유전 정보 및 질병 여부 중 적어도 하나를 포함하는 것인, 다유전자 위험 점수 산출 장치.

13

제11항에 있어서, 상기 특정 기준은, 상기 희귀 유전변이의 위험도를 기반으로 설정되는 것인, 다유전자 위험 점수 산출 장치.

1

프로세서에 의해 수행되는 방법에 있어서,a) 기설정된 제1 알고리즘을 이용하여 개인의 유전체 데이터에 대한 표현형의 추정치를 산출하는 단계;b) 상기 유전체 데이터에 포함된 유전자별 희귀 유전변이를 특정 기준에 따라 복수개의 그룹으로 분류하고, 상기 복수개의 그룹별 유전자형 행렬과 상기 표현형의 추정치에 기초한 기설정된 제2 알고리즘을 이용하여 상기 희귀 유전변이의 효과 크기를 추정하는 단계; 및c) 상기 복수개의 그룹별 유전자형 행렬과 상기 희귀 유전변이의 효과 크기에 기초한 기설정된 제3 알고리즘을 이용하여 상기 희귀 유전변이 다유전자 위험 점수를 산출하는 단계를 포함하는, 다유전자 위험 점수 산출 방법.

2

제1항에 있어서, 상기 유전체 데이터는 개인 고유 번호, 연령, 성별, 유전 정보 및 질병 여부 중 적어도 하나를 포함하는 것인, 다유전자 위험 점수 산출 방법.

3

제1항에 있어서, 상기 특정 기준은, 상기 희귀 유전변이의 위험도를 기반으로 설정되는 것인, 다유전자 위험 점수 산출 방법.

4

제1항에 있어서, 상기 a) 단계는, 나이, 성별 및 유전적 요소 중 적어도 하나의 공변량, 유전적 관계 및 오차를 고려하여 상기 표현형의 추정치를 산출하는 단계를 포함하는 것인, 다유전자 위험 점수 산출 방법.

5

제1항에 있어서, 상기 제1 알고리즘은,상기 표현형이 연속형 변수인 경우에는 의 수식 1의 형태이고, 상기 표현형이 이진형 변수인 경우에는 의 수식 2의 형태이며,여기서, y는 상기 표현형이고, X는 공변량이고, a는 계수이고, b는 유전적 관계를 나타내는 항이며, ε은 오차항인 것인, 다유전자 위험 점수 산출 방법.

6

제1항에 있어서, 상기 b) 단계는,b-1) 상기 희귀 유전변이를 상기 특정 기준에 따라 상기 복수개의 그룹으로 분류하고, 상기 복수개의 그룹별로 유전자형 행렬을 구성하는 단계;b-2) 상기 유전자형 행렬 및 상기 표현형의 추정치에 기초한 상기 제2 알고리즘을 이용하여 상기 희귀 유전변이의 효과 크기를 추정하는 단계; 및b-3) 상기 효과 크기가 기설정된 임계값 이상인 경우, 퍼스 바이어스 보정(Firth bias correction) 방법에 기초하여 상기 효과 크기를 재추정하는 단계를 포함하는, 다유전자 위험 점수 산출 방법.

7

제6항에 있어서, 상기 제2 알고리즘은 , , 의 수식 3의 형태이고,여기서, 연속형 변수에 대해서 이고, 이진형 변수에 대해서 이고, , 및 는 각각 상기 희귀 유전변이의 효과 크기를 나타내는 항이며, 상기 ε은 오차항인 것인, 다유전자 위험 점수 산출 방법.

8

제6항에 있어서, 상기 b-1) 단계는,상기 유전체 데이터에 포함된 유전자들의 대립 유전자 개수가 기설정된 개수보다 작은 경우에 상기 유전자들을 초희귀 유전변이로 분류하고, 상기 초희귀 유전변이를 하나의 희귀 유전변이로 그룹화하는 단계를 포함하는 것인, 다유전자 위험 점수 산출 방법.

9

제1항에 있어서, 상기 제3 알고리즘은 의 수식 4의 형태이고,여기서, 는 상기 유전자형 행렬이고, 는 상기 희귀 유전변이의 효과 크기인 것인, 다유전자 위험 점수 산출 방법.

10

제1항에 있어서, d) 상기 희귀 유전변이 다유전자 위험 점수와 흔한 유전변이에 대한 다유전자 위험 점수 각각에 기설정된 가중치를 부여하여 최종 다유전자 위험 점수를 산출하고, 상기 최종 다유전자 위험 점수에 기초하여 질병을 예측하는 질병 예측 모형을 생성하는 단계를 더 포함하는, 다유전자 위험 점수 산출 방법.

11

통신 모듈;적어도 하나 이상의 프로세서; 및상기 프로세서와 전기적으로 연결되고, 상기 프로세서에서 수행되는 적어도 하나의 코드(code)가 저장되는 메모리를 포함하고,상기 메모리는 상기 프로세서를 통해 실행될 때 상기 프로세서가,기설정된 제1 알고리즘을 이용하여 개인의 유전체 데이터에 대한 표현형의 추정치를 산출하고, 상기 유전체 데이터에 포함된 유전자별 희귀 유전변이를 특정 기준에 따라 복수개의 그룹으로 분류하고, 상기 복수개의 그룹별 유전자형 행렬과 상기 표현형의 추정치에 기초한 기설정된 제2 알고리즘을 이용하여 상기 희귀 유전변이의 효과 크기를 추정하며, 상기 복수개의 그룹별 유전자형 행렬과 상기 희귀 유전변이의 효과 크기에 기초한 기설정된 제3 알고리즘을 이용하여 상기 희귀 유전변이 다유전자 위험 점수를 산출하도록 야기하는 코드를 저장하는, 다유전자 위험 점수 산출 장치.

14

제11항에 있어서, 상기 메모리는 상기 프로세서로 하여금, 나이, 성별 및 유전적 요소 중 적어도 하나의 공변량, 유전적 관계 및 오차를 고려하여 상기 표현형의 추정치를 산출하도록 야기하는 코드를 저장하는 것인, 다유전자 위험 점수 산출 장치.

15

제11항에 있어서, 상기 제1 알고리즘은,상기 표현형이 연속형 변수인 경우에는 의 수식 1의 형태이고, 상기 표현형이 이진형 변수인 경우에는 의 수식 2의 형태이며,여기서, y는 상기 표현형이고, X는 공변량이고, a는 계수이고, b는 유전적 관계를 나타내는 항이며, ε은 오차항인 것인, 다유전자 위험 점수 산출 장치.

16

제11항에 있어서, 상기 메모리는 상기 프로세서로 하여금,상기 희귀 유전변이를 상기 특정 기준에 따라 상기 복수개의 그룹으로 분류하고, 상기 복수개의 그룹별로 유전자형 행렬을 구성하고, 상기 유전자형 행렬 및 상기 표현형의 추정치에 기초한 상기 제2 알고리즘을 이용하여 상기 희귀 유전변이의 효과 크기를 추정하며, 상기 효과 크기가 기설정된 임계값 이상인 경우, 퍼스 바이어스 보정(Firth bias correction) 방법에 기초하여 상기 효과 크기를 재추정하도록 야기하는 코드를 저장하는, 다유전자 위험 점수 산출 장치.

17

제16항에 있어서, 상기 제2 알고리즘은 , , 의 수식 3의 형태이고,여기서, 연속형 변수에 대해서 이고, 이진형 변수에 대해서 이고, , 및 는 각각 상기 희귀 유전변이의 효과 크기를 나타내는 항이며, 상기 ε은 오차항인 것인, 다유전자 위험 점수 산출 장치.

18

제16항에 있어서, 상기 메모리는 상기 프로세서로 하여금,상기 유전체 데이터에 포함된 유전자들의 대립 유전자 개수가 기설정된 개수보다 작은 경우에 상기 유전자들을 초희귀 유전변이로 분류하고, 상기 초희귀 유전변이를 하나의 희귀 유전변이로 그룹화하도록 야기하는 코드를 저장하는 것인, 다유전자 위험 점수 산출 장치.

19

제11항에 있어서, 상기 제3 알고리즘은 의 수식 4의 형태이고,여기서, 는 상기 유전자형 행렬이고, 는 상기 희귀 유전변이의 효과 크기인 것인, 다유전자 위험 점수 산출 장치.

20

제11항에 있어서, 상기 메모리는 상기 프로세서로 하여금,상기 희귀 유전변이 다유전자 위험 점수와 흔한 유전변이에 대한 다유전자 위험 점수 각각에 기설정된 가중치를 부여하여 최종 다유전자 위험 점수를 산출하고, 상기 최종 다유전자 위험 점수에 기초하여 질병을 예측하는 질병 예측 모형을 생성하도록 야기하는 코드를 저장하는, 다유전자 위험 점수 산출 장치.