김소연 교수 연구실 | 아주대학교 소프트웨어학과

김소연 연구실

아주대학교 소프트웨어학과 김소연 교수

Graph Neural Network

Explainable AI

의료 인공지능

|김소연 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

홈

김소연 연구실

아주대학교 소프트웨어학과 김소연 교수

김소연 연구실은 소프트웨어 기반 의료 인공지능을 수행합니다. 그래프 신경망 모델로 환자 간 유사도와 인구 집단 구조를 그래프로 구성하고, 지도·반지도 학습을 통해 질병 위험과 예후를 예측합니다. 또한 GNNExplainer 기반의 feature importance 및 attention 신호를 활용해 임상 변수의 기여도를 설명합니다. 라벨이 없는 멀티모달 의료 데이터에 대한 자가학습과 생성형 AI 기반 종단 예측을 목표로 하는 플랫폼 개발을 진행합니다.

Graph Neural NetworkExplainable AI의료 인공지능Survival PredictionSemi-Supervised Learning

대표 연구 분야

연구 영역 전체보기

설명가능 그래프 신경망 기반 조기 진단 및 바이오마커 해석

Explainable GNNs for Early Diagnosis and Biomarker Interpretation

연구 분야 상세보기

설명가능 그래프 신경망 기반 조기 진단 및 바이오마커 해석

Explainable GNNs for Early Diagnosis and Biomarker Interpretation

연구 분야 상세보기

그래프 기반 생존 예측 및 임상 결과 추론

Graph-Based Survival Prediction and Clinical Outcome Inference

연구 분야 상세보기

라벨-희소 멀티모달 의료를 위한 반지도 그래프 표현학습 및 자가학습

Semi-/Self-Supervised Graph Representation for Label-Scarce Multimodal Healthcare

연구 분야 상세보기

연구 성과 추이

표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

주요 논문

논문 전체보기

Article

인용수 0

2025

Semi-Supervised Fatty Liver Classification Using Attention-Based Graph Neural Network Models

So Yeon Kim, Sehee Wang, Kyung-Ah Sohn, Eun Kyung Choe

IF 2.3 (2025)

Journal of Korean Medical Science

배경: 지방간 질환은 대사증후군, 심혈관 질환, 간경변증과 연관된 흔한 질환이며, 시의적절하고 정확한 진단이 중요하다. 임상 연구에서 딥러닝 모델을 도입하는 경우, 대개 라벨이 지정된 데이터가 부족하다는 문제가 제기된다. 본 연구는 라벨이 제한된 데이터에서도 지방간 질환을 예측하기 위해 주의(attention) 메커니즘을 갖춘 그래프 기반 딥러닝 모델의 효과를 평가하고자 하였다. 방법: 우리는 건강검진에서 얻은 임상 변수를 중심으로 7,953명의 개체로 구성된 데이터셋을 활용하였다. 반지도학습(semi-supervised learning) 환경에서 지방간 질환 예측을 위해 주의 메커니즘이 포함된 그래프 신경망(Graph Neural Networks, GNNs)을 평가하였다. 특징 중요도 분석에는 GNNExplainer를 사용하였고, 서로 다른 위험 요인을 갖는 군집을 확인하기 위해 하위집단(subgroup) 분석을 수행하였다. 결과: < 0.05) 로지스틱 회귀(logistic regression)와 비교하여 대부분의 라벨링 시나리오에서 유의한 성능 차이를 보였다. 각 클래스당 라벨 10개만 사용할 경우, 그래프 어텐션 네트워크(Graph Attention Network, GAT)와 그래프 어텐션을 포함한 간소화 그래프 트랜스포머(Simplified Graph Transformer with Graph Attention)는 각각 AUC 0.7049 ± 0.0570 및 0.7184 ± 0.0395를 달성하였으며, 라벨 100개를 사용했을 때는 AUC 0.7893 ± 0.0171를 달성하였다. 특징 중요도 분석에서는 HbA1c(상대 중요도 점수 = 1.0), 체지방량(0.998), 그리고 포도당(0.6934)을 가장 영향력 있는 예측 인자로 확인하였다. 하위집단 분석에서는 두 가지의 뚜렷한 환자 군집이 관찰되었는데—하나는 대사 위험 요인을 특징으로 하고 다른 하나는 인구통계학적 및 생활양식 요인을 특징으로 하는 군집이었다—이는 지방간 질환에서 개별화된 위험 계층화의 가능성을 강조한다. 결론: 주의 기반 GNN은 소수의 라벨 데이터만으로도 지방간 질환에 대해 강력한 예측 성능을 보였다. 본 방법론은 라벨 제약이 있는 상황에서, 그래프 기반 학습이 일상적 임상 데이터의 관계 구조를 활용하여 데이터 효율적이고 개별화된 위험 평가를 지원할 수 있음을 보여준다.

https://doi.org/10.3346/jkms.2026.41.e30

Leverage (statistics)

Artificial neural network

Fatty liver

Graph

Labeled data

Pattern recognition (psychology)

Supervised learning

Preprint

인용수 0

2024

Semi-Supervised Graph Representation Learning with Human-centric Explanation for Predicting Fatty Liver Disease

So Yeon Kim, Sehee Wang, Eun Kyung Choe

arXiv (Cornell University)

임상 환경에서 특히 지방간 질환의 예측과 관련하여 제한된 라벨 데이터의 문제를 해결하기 위해, 본 연구는 반지도 학습 프레임워크 내에서 그래프 표현 학습의 잠재력을 탐색한다. 그래프 신경망(GNN)을 활용하여, 본 접근법은 건강검진 데이터로부터 위험 패턴을 식별하기 위해 대상(피험자) 유사성 그래프를 구성한다. 다양한 GNN 접근법의 효과는 라벨이 매우 적은 표본에서도 입증된다. 방법론의 핵심은 설명 가능한 GNN을 통해 인간 중심적 설명을 포함하는 것으로, 향상된 해석 가능성과 임상적 관련성을 위한 개인화된 특징 중요도 점수를 제공하며, 그래프 표현 학습과 인간 중심적 설명에 중점을 둔 본 접근법이 의료 실무를 발전시키는 데 기여할 수 있음을 강조한다.

http://arxiv.org/abs/2403.02786

Graph

Fatty liver

Representation (politics)

Computer science

Disease

Artificial intelligence

Machine learning

Natural language processing

Computational biology

Medicine

Article

인용수 22

2023

Personalized Explanations for Early Diagnosis of Alzheimer’s Disease Using Explainable Graph Neural Networks with Population Graphs

So Yeon Kim

IF 3.8 (2023)

Bioengineering

최근 그래프 신경망의 발전을 활용하여, 본 연구는 상관 기반 인구 그래프(correlation-based population graph) 내에서 그래프 합성곱 신경망(Graph Convolutional Networks, GCNs)을 적용하는 방법을 제안함으로써 알츠하이머병(AD) 예후를 향상시키고 AD 진행의 복잡성을 조명하고자 한다. 이러한 방법론은 인구통계 및 신경영상 데이터의 내재적 구조와 상관관계를 활용하여 베타-아밀로이드(amyloid-beta, Aβ) 양성(positivity)을 예측한다. 본 접근법을 검증하기 위해, 기존의 기계학습 모델과 무작위로 간선을 할당한 GCN 모델을 포함하여 광범위한 성능 비교를 수행하였다. 그 결과, 알츠하이머병 신경영상 이니셔티브(Alzheimer's Disease Neuroimaging Initiative, ADNI) 데이터셋에서 서로 다른 표본 집단 전반에 걸쳐 상관 기반 GCN 모델이 일관되게 우수한 성능을 보이는 것으로 나타났으며, 이는 효과적인 패턴 인식과 정확한 예측을 위해 인구 그래프에서 상관 구조를 정확히 반영하는 것이 중요함을 시사한다. 또한, GNNExplainer를 사용하여 모델의 의사결정 과정을 탐색한 결과, 서로 다른 집단에서 Aβ 양성을 시사하는 고유한 바이오마커 세트가 확인되어 AD 진행의 이질성을 밝혀주었다. 본 연구는 제안된 접근법이 보다 정교한 AD 예후 평가에 대한 가능성을 지니며, 잠재적으로 보다 개인화되고 정밀한 치료 전략을 알리는 데 기여할 수 있음을 강조한다. 향후 연구는 다양한 데이터 소스를 통합하고 종단 데이터를 활용하며, 모델의 해석가능성을 개선함으로써 이러한 결과를 확장할 수 있으며, 이는 다른 복합 질환에도 광범위하게 적용될 수 있다.

https://doi.org/10.3390/bioengineering10060701

Interpretability

Neuroimaging

Graph

Computer science

Correlation

Artificial intelligence

Machine learning

Population

Disease

Data science

최신 정부 과제

과제 전체보기

2025년 8월-2030년 8월

|200,000,000원

생성형 AI 기반 멀티모달 의료 종단 예측 모델 개발 및 개인 맞춤형 질병 궤적 예측과 조기 진단이 가능한 범용 정밀의료 플랫폼 구현

본 연구의 최종목표는 생성형 AI 기반 멀티모달 의료 종단 예측 파운데이션 모델을 개발하여 개인 맞춤형 질병 궤적 예측과 조기 진단이 가능한 범용 정밀의료 플랫폼을 구현하는 것이다.구체적으로는 한국인 21만 명 대규모 종단 코호트(KoGES) 데이터를 기반으로 MMoE(Multimodal Mixture-of-Experts)와 Time-Series Diffu...

멀티모달 학습

종단 예측

의료 인공지능

생성형 인공지능

정밀의학

2022년 2월-2025년 2월

|109,845,000원

라벨이 없는 멀티모달 의료 데이터의 지도 학습을 위한 딥 러닝 기반 자가 학습 모델 개발 및 응용

개인의 환경, 유전, 생물학적 특성 등에 따라 개인에게 최적화된 의료 서비스를 제공하는 정밀 의학(Precision Medicine)의 대두와 함께 방대하게 축적된 다양한 수준의 의료 빅데이터(혈액, 영상, 환경, 유전, 기저질환, 약복용력 등)을 효과적으로 학습하는 딥 러닝 기반 방법론의 활용성이 증가하고 있다. 하지만 실제 의료 데이터의 특성상 labe...

기계학습

딥 러닝

의료 인공지능

자가 학습

정밀의학

그래프 신경망 네트워크

의료 영상 데이터

임상 데이터

건

주관|

2022년 2월-2025년 2월

|122,050,000원

라벨이 없는 멀티모달 의료 데이터의 지도 학습을 위한 딥 러닝 기반 자가 학습 모델 개발 및 응용

-실제 다양한 수준의 임상 데이터(multi-modal data)는 매우 복잡하게 상호 유기적으로 연결되어 있어 정확한 질병 예측 및 진단을 위해서는 그래프 기반 인공지능 알고리즘 개발이 필수적임 -고차원의 그래프 데이터를 모델링하기 위한 그래프 기반 딥 러닝 알고리즘인 Graph Neural Network(GNN) 연구가 의료 분야에서도 최근 많은 관심을 받고 있지만, -다양한 수준의 데이터를 통합할 때 발생하는 제약 상황으로 인해 단일 수준의 데이터를 적용하는 데에 그침 -실제 의료 데이터는 임상 정보와 더불어 환경, 복용력, 사회력 등 복합적인 정보를 활용하는 것이 필수적이나 모든 수준에서 label이 있는 sample 수의 더욱 적기 때문에 self-supervised learning 방법으로 다양한 수준의 임상 데이터의 활용성을 극대화함. 1차년도에 활용한 알고리즘을 그래프 구조에 활용한 Graph contrastive learning 방법을 활용하면 이를 구현할 수 있음 -위의 Self-supervised graph neural network 연구 개발을 위해서는 1차년도와 같이 supervised graph neural network를 현재 보유한 서울대병원 데이터에 적용하는 것이 선행되어야하며 현재 공공 의료 데이터와 더불어 서울대병원 건강검진 데이터를 기반으로 한 GNN 선행 연구를 진행중임 -1차년도에 개발한 영상 데이터 기반 지도 학습 모델과 2차년도 연구의 선행 연구인 GNN 기반 지도 학습 모델을 토대로 GNN 기반 self-supervised learning 모델의 고도화를 진행할 계획임

기계학습

딥 러닝

의료 인공지능

자가 학습

정밀의학

그래프 신경망 네트워크

의료 영상 데이터

임상 데이터

건