본 연구과제는 마이크로바이옴 데이터로부터 정확한 질병 예측을 위해 인공지능(Artificial Intelligence, AI) 기법을 활용한 질병 연관 마커 발굴 및 질병 예측 모형을 개발하고자 함. 이에, 본연구팀은 공개 마이크로바이옴 데이터베이스 (Data Base, DB)를 바탕으로, 마이크로바이옴 데이터 및 임상자료 등을 통합하여 각 개인별로 특정 ...
마이크로바이옴
인공지능
질병예측모형
시각화
데이터베이스
2
주관|
2022년 5월-2025년 2월
|67,787,000원
마이크로바이옴 기반 인공지능 질병 예측모형 개발 연구
본 연구팀은 공개 마이크로바이옴 DB(HMP, MetaHIT 등)를 바탕으로, 마이크로바이옴 데이터 및 임상자료 등을 통합하여 각 개인별로 특정 질환에 대한 위험도를 예측하기 위한 수학적‧통계적 모형을 개발하고자 함. 본 연구과제의 세부 연구주제는
(1) 질병 예측인자 발굴을 위한 인공지능 기반 연구
(2) 설명가능 인공지능(Explainable AI, XAI) 질병 예측모형 개발 연구
(3) 시각화 소프트웨어 개발 및 통합 데이터베이스(DB) 구축
[1차년도]
i. 질병 예측인자 발굴을 위한 인공지능 기반 연구 - 머신러닝/ 딥러닝 모형에 기초한 질병 예측 인자 발굴 모형 개발
ii. 예측인자 발굴 결과의 데이터베이스(DB) 구축 - 공개 데이터베이스(HMP, MetaHIT 등) 자료 수집 및 통합 DB 기반 구축
[2차년도]
iii. 설명가능 인공지능(XAI) 질병 예측모형 개발 연구 - XAI 모형에 기초한 마이크로바이옴 질병 진단 예측모형 개발
[3차년도]
iv. 시각화 소프트웨어 개발 및 통합 데이터베이스(DB) 구축
- 질병지표 발굴 및 통합 모형 분석 결과의 web 기반 시각화 소프트웨어 구현
- 마이크로바이옴 분석결과의 생물학적 해석을 위한 통합 DB 시스템 구축
● 비독립적 표본의 특성을 고려한 통계분석모형 개발 연구
전장 유전체 연구(Genome-wide association study; GWAS)에서 특정 질환·질병과 연관성이 있는 후보 유전자를 발굴하고자 할 때, 통계분석 모형에서 근본이 되는 가정은 수집된 표본의 독립성 여부임. 수집된 표본이 population stratification (인구집단 층화)으로 비독립적 표본인 경우는 분석 결과에 false positive의 비율을 높이는 문제점이 발생함. 이러한 문제를 해결하기 위해, 다양한 통계적 접근 방법이 제안되었음.
본 연구에서는 차세대 염기서열 자료를 분석함에 있어, 비독립적 표본인 경우(가족 코호트 및 다중 코호트, 다인종 코호트 자료, 근친 교배한 동물 자료 등)를 고려한 다양한 분석 모형을 고급 통계기법을 활용하여 개발하고자 함.
● 공통변이와 희귀변이 정보를 결합한 연관성 분석모형 개발 연구
차세대 염기서열자료의 대부분을 차지하는 희귀변이는 공통변이와 달리 소수의 사람들에게서만 발견되는 변이로, 개별 마커 단위로는 통계적 유의성을 얻기가 어려움. 희귀변이는 기존의 전장유전체 연관성 분석 방법이 아닌, 유전자 또는 LD (Linkage disequilibrium) block 단위로 병합하여 검정하는 방법들이 제안되었음. 이러한 접근 방법을 희귀변이와 공통변이를 함께 고려하는 통합 분석모형 방법으로 확장하고자 함. 특히 모집된 표본이 독립인 경우뿐만 아니라, 비독립 표본에 적용 가능한 통계모형을 개발하고자 함. 이를 통해 다양한 실험 디자인(가족 코호트, 쌍둥이 코호트, 다중 코호트 데이터 등)에 적용 가능한 통합 유전체분석 모형으로, 그 활용도가 매우 높다고 기대함.
● 차세대 염기서열 자료 기반 유전자-유전자 상호작용을 고려한 분석모형 개발 연구
질병의 예방 및 원인 규명, 원천적인 치료 타켓 마커 발굴을 위한 생물학적 기작(biological mechanism)을 이해하기 위해서는 단일 유전자와 질병과의 관계만으로 충분히 설명하지 못하는 한계(missing heritability issue)가 발견됨. 이러한 한계점에 대한 해결책 중 하나로, 유전자-유전자 상호작용 연구의 중요성이 대두됨. 차세대 염기서열 자료의 희귀변이 정보를 활용한 유전자-유전자 상호작용 분석 모형은 개발되었지만, 비독립 표본에 대한 연구는 미비한 상황임. 본 연구에서는 고급 통계 모형을 활용하여, 다양한 비독립 표본 코호트 디자인에 적용 가능한 유전자-유전자 상호작용 통계분석모형을 개발하고자함. 이를 통해, 차세대 염기서열 자료의 분석 기술을 고도화하여, 질병의 원인 유전자 마커 발굴 전략을 보다 다방면화 할 수 있을 것으로 기대함.
● 환경적 요인과 차세대 염기서열 자료와의 상호작용을 고려한 분석모형 개발 연구
복합질환 및 질병의 원인을 규명함에 있어, 유전적 요인 뿐 아니라, 환경적 요인도 중요한 부분을 차지함. 이러한 환경변수들을 고려한 통합 상호작용 모형을 개발의 일환으로, 본 연구는 차세대 염기서열을 통해 생산된 비독립 표본의 유전체 정보(공통변이, 희귀변이)와 환경요인의 상호작용 분석 모형을 개발하고자 함. 이번 연구를 통해 새롭게 개발된 모형을 실제 데이터에 적용하여, 선행 분석 사례와 비교하고자 함. 이를 통해 실제 차세대 염기서열 자료가 정밀의료 구현에서 어떠한 역할을 할 수 있을지 그 유용성을 보다 면밀히 검토해보고자 함.