목적: 본 연구는 국가 설문 자료를 이용하여 만성폐쇄성폐질환(COPD) 환자의 흡연 상태를 예측하기 위한 딥러닝 모델을 개발하고 검증하고자 한다. 방법: 대한민국 국민건강영양조사(Korea National Health and Nutrition Examination Survey) 2007-2018년 자료를 사용하여 5466명의 COPD-적합 사례를 추출하였다. 자료 수집에는 연령, 성별, 폐기능검사 결과 등을 포함한 21개 예측변수를 비롯하여 인구통계학적, 행동적, 임상적 변수가 포함되었다. 종속변수인 흡연 상태는 흡연자 또는 비흡연자로 범주화하였다. 잔차 신경망(Residual Neural Network; ResNN) 모델을 개발하고 이를 5가지 기계학습 알고리즘(랜덤 포레스트, 의사결정나무, 가우시안 나이브 베이즈, k-최근접 이웃, AdaBoost) 및 2가지 딥러닝 모델(다층 퍼셉트론, TabNet)과 비교하였다. 내부 검증은 5-폴드 교차검증으로 수행하였고, 모델 성능은 수신자조작특성(Receiver Operating Characteristic) 곡선 아래 면적(AUROC), 민감도, 특이도, F1-score로 평가하였다. 결과: ResNN은 AUROC 0.73, 민감도 70.1%, 특이도 75.2%, F1-score 0.67을 달성하여, COPD 환자의 흡연 상태 예측에서 기존의 기계학습 및 딥러닝 모델보다 우수한 성능을 보였다. 설명가능 인공지능(Shapley additive explanations)은 성별, 연령, 주관적 건강 상태를 포함한 핵심 예측변수를 확인하였다. 결론: 본 딥러닝 모델은 COPD 환자의 흡연 상태를 정확하게 예측하며, 표적 중재를 위한 고위험 지속 흡연자를 탐지하는 의사결정 지원 도구로서의 잠재력을 제공한다. 향후 연구에서는 외부 검증을 수행하고 추가적인 행동 및 심리 변수를 반영하여 일반화 가능성과 성능을 향상시켜야 한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.