주관|2020년 2월-2023년 2월
|200,000,000원 딥러닝을 이용한 영상/빅데이터 기반 골절 예측 모델 개발
○ 연구의 배경 요약
● 골다공증성 골절은 고령화 사회에서 큰 사회적인 부담을 유발하며 점차 증가하는 질환으로, 이를 예측할 수 있는 진단법인 골밀도 검사가 있지만 실제 골밀도 상 골다공증이 아닌 환자에서 80%의 골절이 발생한다는 점에서 더 성능이 좋은 예측 모델이 필요함
● 기존의 골밀도 이외에도 고해상도 주변 정량 CT (HRpQCT), 해면골점수(TBS), 골 조직 검사 등의 방법이 있지만 가격이 비싸거나, 기계 보급률이 낮아 시행이 어렵거나, 단독으로 골절을 예측하기에는 부족하거나, 혹은 너무 침습적인 점에서 각자의 한계점이 있음.
○ 연구 가설
● 영상 및 빅데이터를 기반으로 한 딥러닝 모델으로 우수한 성능의 골절 예측 모델을 구축 가능함.
○ 연구 방법
(1) 딥러닝을 이용한 영상 기반 골절 예측 모델 개발
○ 모델의 개요
▷ 입력 영상
① 척추 X-ray 정면, 측면
② DEXA 영상(척추, 고관절 모두 포함)
③ 척추를 포함하는 CT (chest, abdomen CT)
▷ 출력 결과
학습을 통해 현재 골절이 없는 영상을 바탕으로 미래에 골절이 발생할 환자를 구별해 내고, 골절이 발생할 확률을 도출하는 모델을 구축함. 나아가서, 골절 발생 부위를 미리 예측하고 영상을 학습할 때 모델에서 어떤 양상이 중요하게 인식되는지를 도출하여 단순화된 모델 구축을 시도함.
▷ 이미지 전처치: 이미지범위 중 바이아스(bias)가 될 수 있는 범위(동맥의 석회화 부위 등)를 영상에서 제외함.
▷ 요소 추출(Feature extraction)
● 매뉴얼 추출
● 컨볼루션 신경망(Convoluted Neural Network, CNN)을 이용한 인공지능 추출
▷ 요소 선택(Feature selection)
● 요소의 수가 많기 때문에 모델의 과적합(overfitting)을 방지하기 위해 요소 선택 과정이 필수적임.
● 강건성(Robustness), 절대 중간값 편차 평가, Correlation coefficient를 기준으로 제외 및 LASSO cox regression model 이용
→ 선택된 요소들을 이용하여 골절 예측도를 예측하는 다변량 콕스 회귀 모델(multivariate cox regression model)을 구축함.
○ 검증(Validation)
- Training set/ Tuning set: 1:5로 cross-validation
- Validation set: 분당 서울대학교병원 및 보라매병원의 영상 자료로 검증.
(2) 딥러닝을 이용한 빅데이터 기반 골절 예측 모델 개발
○ 연구 대상 데이터
▷ 보험 공단 데이터
● 2008년 건강검진 생애전환기 건강검진 수검자 (69개 변수, 50만명)
● 2008년 수검자의 2018년 까지 골절 발생 여부 및 골절 부위
▷ 표준데이터모델(common data model, CDM) 데이터
- CDM이란 분산형 바이오 빅데이터 플랫폼의 일환으로, 세계 각국의 의료기관이 보유한 각종 의료정보를 국제적으로 표준화하여 연구자나, 기업, 정부 기관 등이 활용할 수 있도록 하는 기술임.
- 현재 서울대학교병원에서 CDM으로 변환이 진행된 환자정보, 진료데이터, 검사데이터 항목을 입력하고 출력변수는 골절 여부 및 골절 부위의 확률로 설정함.
○ 연구 방법
▷ 컨볼루션 신경망을 이용한 딥러닝을 시행하여 골절 확률 및 부위를 예측하고자 함.
○ 검증(Validation)
▷ 데이터 셋 내에서 1:5로 cross-validation 시행하고, 같은 형식의 CDM이 구축된 분당 서울대병원, 삼성, 아산, 서울성모병원, 강원대 병원에서 연구에서 구축한 예측 모델의 성능을 검증함
(3) 영상과 임상 데이터 모델을 통합한 골절 예측 모델 구축 및 안정화
▷ (1)에서 구축한 영상 데이터 모델에 (2)에서 구축한 임상데이터 모델을 통합하여 구축