메타분석 및 생물경로 기반 기계 학습을 이용한 맞춤형 항암제 내성 예측 방법
Method of Predicting Cancer Drug Resistance Using Meta-analysis-derived, Personalized Pathway-Based Machine Learning Approach
특허 요약
본 발명은 메타분석 및 생물경로 기반 기계 학습을 이용한 맞춤형 항암제 내성 예측 방법에 관한 것으로, 보다 상세하게는 후천성 약물 내성의 자동 검출을 위해 공개적으로 이용 가능한 후천성 약물 내성 및 내인성 약물 내성의 게놈 코호트 (genomic cohorts) 정보를 이용하여 내성 관련 코호트를 스크리닝하고 병합, 이를 기반으로 개인화된 경로 스코어 알고리즘과 결합된 페널티 회귀(Penalized regression)를 사용하여 매우 높은 정확도와 높은 수준의 일반화(generalizability) 능력을 가진 맞춤 항암제 내성모델을 확립하였으며, 본 발명의 모델은 후천성 약물 내성 예측뿐만 아니라 내인성 약물 내성 및 후천성 약물 내성 간의 이전가능한 예측 판단이 가능하다. 본 발명의 메타분석 및 생물경로 기반 기계 학습을 이용한 맞춤형 항암제 내성 예측 방법을 이용하여 후천성 탁산 내성의 다변수 예측 모델을 개발하고 검증한 결과, 후천성 탁산 내성 모델은 1.000의 AUPRC (area under the precision-recall curve), 0.007의 브라이어 점수(Brier score), 100%의 민감도와 특이도 및 1.000의 AUROC(Arear Under Receiver Operating Characterisic)의 값을 가지는 완벽한 성능을 나타내는 것을 확인하였다.
청구항
번호청구항
2

제1항에 있어서, 상기 약물은 탁산인 것을 특징으로 하는, 개인화된 경로 기반 기계 학습을 이용한 약물 내성 여부에 대한 정보를 제공하는 방법.

1

(a) 약물 내성 예측 대상을 선택하는 단계; (b) 선택된 예측 대상 데이터를 수집하고 선택적으로 처리하는 단계; (c) 기계 학습 알고리즘을 통해 학습하는 단계; 및 (d) AUROC(Arear Under Receiver Operating Characterisic), AUPRC(area under the precision-recall curve), 브라이어 점수(Brier score; BS), 정밀도(precision), 리콜(recall), 정확도(accuracy; ACC), 매튜 상관계수 (Matthews correlation coefficient; MCC) 및 F1 점수로 구성된 군에서 선택된 하나 이상을 이용하여 검증하는 단계;를 포함하는, 개인화된 경로 기반 기계 학습을 이용한 약물 내성 여부에 대한 정보를 제공하는 방법.

3

제1항에 있어서, 상기 (b) 단계의 예측 대상 데이터는 유전자 발현 정보인 것을 특징으로 하는, 개인화된 경로 기반 기계 학습을 이용한 약물 내성 여부에 대한 정보를 제공하는 방법.

4

제1항에 있어서, 상기 (c) 단계의 기계학습 알고리즘은 (ⅰ)공개 게놈 코호트 (genomic cohorts) 정보를 이용하여 내성 관련 코호트를 스크리닝하고 병합하는 단계;(ⅱ) 생물학적 경로 정보 데이터를 수집하는 단계;(ⅲ) 각각의 개별 데이터에 대해 경로 조절장애 점수(pathway dysregulation scores; PDS)를 측정하여, 경로 이상을 수치화하는 단계;(ⅳ) 상기 경로 조절 장애 점수를 엘라스틱-네트 방법으로 정규화 시키는 단계;(ⅴ) 엘라스틱-네트 방법으로 정규화된 데이터를 N(총 샘플수)번 반복되는 LOOCV(leave-one-out cross validation) 절차를 사용하여, 정규화 파라미터의 최적 값을 식별하는 단계; (ⅵ) EPSGO(Efficient Parameter Selection via Global Optimization) 알고리즘을 이용하여 파라미터를 최적화하는 단계; 및 (ⅶ) EPSGO 알고리즘을 사용하여 도출된 파라미터에서 넌-제로 경로 불일치 계수(non-zero pathway dysregulation coefficients)를 가진 예측 변수 세트를 선별하는 단계;를 포함하는 방법으로 확립한 것을 특징으로 하는, 개인화된 경로 기반 기계 학습을 이용한 약물 내성 여부에 대한 정보를 제공하는 방법.

5

제4항에 있어서, 상기 (ⅰ) 단계의 공개 게놈 코호트 (genomic cohorts) 정보는 NCBI(National Center for Biotechnology Information)의 GEO (Gene Expression Omnibus), 유럽 생물정보학 연구소의 어레이익스프레스(ArrayExpress), CCLE(Cancell Cell Line Encyclopedia) 및 CGP(Cancer Genome Project)의 공개 게놈 코호트 (genomic cohorts) 정보인 것을 특징으로 하는, 개인화된 경로 기반 기계 학습을 이용한 약물 내성 여부에 대한 정보를 제공하는 방법.

6

제4항에 있어서, 상기 (ⅱ) 단계의 생물학적 경로 정보는 KEGG(Kyoto Encyclopedia of Genes and Genomes), BioCarta 및 NCI_PID (National Cancer Institute Nature Pathway Interaction Database)에서 추출한 경로 정보(pathway information)인 것을 특징으로 하는, 개인화된 경로 기반 기계 학습을 이용한 약물 내성 여부에 대한 정보를 제공하는 방법.

7

제4항에 있어서, 상기 (ⅲ) 단계의 경로 조절장애 점수는 패시파이어 알고리즘(Pathifier algorithm)을 사용하여 도출하는 것을 특징으로 하는, 개인화된 경로 기반 기계 학습을 이용한 약물 내성 여부에 대한 정보를 제공하는 방법.

8

제4항에 있어서, 상기 (ⅳ) 단계의 엘라스틱-네트는 라쏘 및 리지 회귀 방법(lasso and ridge regression method)의 페널티를 선형적으로 결합하는 정규화된 회귀 방법인 것을 특징으로 하는, 개인화된 경로 기반 기계 학습을 이용한 약물 내성 여부에 대한 정보를 제공하는 방법.

9

제4항에 있어서, 상기 (ⅵ) 단계의 EPSGO는 온라인 가우스 프로세스(online Gaussian process)를 학습한 것으로, 최대 우도(Maximum likelihood)에 따라 파라미터를 선택하는 메타 휴리스틱 알고리즘(meta-heuristic algorithm)인 것을 특징으로 하는, 개인화된 경로 기반 기계 학습을 이용한 약물 내성 여부에 대한 정보를 제공하는 방법.

10

삭제