주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
Article
|
인용수 0
·
2025Semi-Supervised Fatty Liver Classification Using Attention-Based Graph Neural Network Models
So Yeon Kim, Sehee Wang, Kyung-Ah Sohn, Eun Kyung Choe
IF 2.3 (2025)
Journal of Korean Medical Science
배경: 지방간 질환은 대사증후군, 심혈관 질환, 간경변증과 연관된 흔한 질환이며, 시의적절하고 정확한 진단이 중요하다. 임상 연구에서 딥러닝 모델을 도입하는 경우, 대개 라벨이 지정된 데이터가 부족하다는 문제가 제기된다. 본 연구는 라벨이 제한된 데이터에서도 지방간 질환을 예측하기 위해 주의(attention) 메커니즘을 갖춘 그래프 기반 딥러닝 모델의 효과를 평가하고자 하였다. 방법: 우리는 건강검진에서 얻은 임상 변수를 중심으로 7,953명의 개체로 구성된 데이터셋을 활용하였다. 반지도학습(semi-supervised learning) 환경에서 지방간 질환 예측을 위해 주의 메커니즘이 포함된 그래프 신경망(Graph Neural Networks, GNNs)을 평가하였다. 특징 중요도 분석에는 GNNExplainer를 사용하였고, 서로 다른 위험 요인을 갖는 군집을 확인하기 위해 하위집단(subgroup) 분석을 수행하였다. 결과: < 0.05) 로지스틱 회귀(logistic regression)와 비교하여 대부분의 라벨링 시나리오에서 유의한 성능 차이를 보였다. 각 클래스당 라벨 10개만 사용할 경우, 그래프 어텐션 네트워크(Graph Attention Network, GAT)와 그래프 어텐션을 포함한 간소화 그래프 트랜스포머(Simplified Graph Transformer with Graph Attention)는 각각 AUC 0.7049 ± 0.0570 및 0.7184 ± 0.0395를 달성하였으며, 라벨 100개를 사용했을 때는 AUC 0.7893 ± 0.0171를 달성하였다. 특징 중요도 분석에서는 HbA1c(상대 중요도 점수 = 1.0), 체지방량(0.998), 그리고 포도당(0.6934)을 가장 영향력 있는 예측 인자로 확인하였다. 하위집단 분석에서는 두 가지의 뚜렷한 환자 군집이 관찰되었는데—하나는 대사 위험 요인을 특징으로 하고 다른 하나는 인구통계학적 및 생활양식 요인을 특징으로 하는 군집이었다—이는 지방간 질환에서 개별화된 위험 계층화의 가능성을 강조한다. 결론: 주의 기반 GNN은 소수의 라벨 데이터만으로도 지방간 질환에 대해 강력한 예측 성능을 보였다. 본 방법론은 라벨 제약이 있는 상황에서, 그래프 기반 학습이 일상적 임상 데이터의 관계 구조를 활용하여 데이터 효율적이고 개별화된 위험 평가를 지원할 수 있음을 보여준다.
https://doi.org/10.3346/jkms.2026.41.e30
Leverage (statistics)
Artificial neural network
Fatty liver
Graph
Labeled data
Pattern recognition (psychology)
Supervised learning
2
Preprint
|
인용수 0
·
2024Semi-Supervised Graph Representation Learning with Human-centric Explanation for Predicting Fatty Liver Disease
So Yeon Kim, Sehee Wang, Eun Kyung Choe
arXiv (Cornell University)
임상 환경에서 특히 지방간 질환의 예측과 관련하여 제한된 라벨 데이터의 문제를 해결하기 위해, 본 연구는 반지도 학습 프레임워크 내에서 그래프 표현 학습의 잠재력을 탐색한다. 그래프 신경망(GNN)을 활용하여, 본 접근법은 건강검진 데이터로부터 위험 패턴을 식별하기 위해 대상(피험자) 유사성 그래프를 구성한다. 다양한 GNN 접근법의 효과는 라벨이 매우 적은 표본에서도 입증된다. 방법론의 핵심은 설명 가능한 GNN을 통해 인간 중심적 설명을 포함하는 것으로, 향상된 해석 가능성과 임상적 관련성을 위한 개인화된 특징 중요도 점수를 제공하며, 그래프 표현 학습과 인간 중심적 설명에 중점을 둔 본 접근법이 의료 실무를 발전시키는 데 기여할 수 있음을 강조한다.
http://arxiv.org/abs/2403.02786
Graph
Fatty liver
Representation (politics)
Computer science
Disease
Artificial intelligence
Machine learning
Natural language processing
Computational biology
Medicine
3
Article
|
인용수 22
·
2023Personalized Explanations for Early Diagnosis of Alzheimer’s Disease Using Explainable Graph Neural Networks with Population Graphs
So Yeon Kim
IF 3.8 (2023)
Bioengineering
최근 그래프 신경망의 발전을 활용하여, 본 연구는 상관 기반 인구 그래프(correlation-based population graph) 내에서 그래프 합성곱 신경망(Graph Convolutional Networks, GCNs)을 적용하는 방법을 제안함으로써 알츠하이머병(AD) 예후를 향상시키고 AD 진행의 복잡성을 조명하고자 한다. 이러한 방법론은 인구통계 및 신경영상 데이터의 내재적 구조와 상관관계를 활용하여 베타-아밀로이드(amyloid-beta, Aβ) 양성(positivity)을 예측한다. 본 접근법을 검증하기 위해, 기존의 기계학습 모델과 무작위로 간선을 할당한 GCN 모델을 포함하여 광범위한 성능 비교를 수행하였다. 그 결과, 알츠하이머병 신경영상 이니셔티브(Alzheimer's Disease Neuroimaging Initiative, ADNI) 데이터셋에서 서로 다른 표본 집단 전반에 걸쳐 상관 기반 GCN 모델이 일관되게 우수한 성능을 보이는 것으로 나타났으며, 이는 효과적인 패턴 인식과 정확한 예측을 위해 인구 그래프에서 상관 구조를 정확히 반영하는 것이 중요함을 시사한다. 또한, GNNExplainer를 사용하여 모델의 의사결정 과정을 탐색한 결과, 서로 다른 집단에서 Aβ 양성을 시사하는 고유한 바이오마커 세트가 확인되어 AD 진행의 이질성을 밝혀주었다. 본 연구는 제안된 접근법이 보다 정교한 AD 예후 평가에 대한 가능성을 지니며, 잠재적으로 보다 개인화되고 정밀한 치료 전략을 알리는 데 기여할 수 있음을 강조한다. 향후 연구는 다양한 데이터 소스를 통합하고 종단 데이터를 활용하며, 모델의 해석가능성을 개선함으로써 이러한 결과를 확장할 수 있으며, 이는 다른 복합 질환에도 광범위하게 적용될 수 있다.
https://doi.org/10.3390/bioengineering10060701
Interpretability
Neuroimaging
Graph
Computer science
Correlation
Artificial intelligence
Machine learning
Population
Disease
Data science
4
Article
|
인용수 10
·
2023GNN-surv: Discrete-Time Survival Prediction Using Graph Neural Networks
So Yeon Kim
IF 3.8 (2023)
Bioengineering
생존 예측 모형은 환자의 예후 및 맞춤형 치료에서 핵심적인 역할을 한다. 그러나 이러한 모형의 정확도는 환자 유사성 네트워크를 통합함으로써 개선될 수 있는데, 이는 복잡한 데이터 패턴을 드러낸다. 본 연구는 그래프 신경망(Graph Neural Networks, GNNs)을 사용하여 이러한 네트워크 내의 관계를 활용함으로써 이산형 시간 생존 예측(discrete-time survival predictions)을 향상시키는 GNN-surv를 제안한다. 우리는 암 환자들의 유전체 및 임상 데이터를 바탕으로 이러한 네트워크를 구축하고, Logistic Hazard 및 PMF 생존 모형을 통합하여 그 위에서 다양한 GNN 모형을 학습한다. GNN-surv 모형은 두 개의 비뇨기계 암 데이터셋에서 생존 예측 전반에 걸쳐 전통적인 MLP 모형보다 우수한 성능을 보인다. 또한 그래프 구성 초매개변수 μ 값이 달라지는 조건에서도 견고성과 효과를 유지하며, 시간-의존적 일치도 지수(time-dependent concordance index)에서 최대 14.6% 및 7.9%의 성능 향상과, BLCA 및 KIRC 데이터셋에서 각각 통합 브라이어 점수(integrated brier score)의 26.7% 및 24.1% 감소를 보인다. 특히, 이들 모형은 세 가지 서로 다른 유형의 GNN 모형에 대해서도 효과를 유지하여, 다른 암 데이터셋에도 적응 가능할 잠재력을 시사한다. 본 연구의 GNN-surv 모형이 보이는 우수한 성능은 종양학 및 맞춤형 의학 분야에서의 광범위한 적용 가능성을 강조하며, 환자 예후와 맞춤형 치료 계획 수립을 위한 보다 정확한 도구를 임상의에게 제공한다. 향후 연구에서는 다른 생존 모형이나 추가 데이터 양식(data modalities)을 통합함으로써 이러한 모형을 더욱 최적화할 수 있다.
https://doi.org/10.3390/bioengineering10091046
Computer science
Data mining
Machine learning
Artificial neural network
Hyperparameter
Artificial intelligence
5
Article
|
인용수 9
·
2021Multi-layered network-based pathway activity inference using directed random walks: application to predicting clinical outcomes in urologic cancer
So Yeon Kim, Eun Kyung Choe, Manu Shivakumar, Dokyoon Kim, Kyung-Ah Sohn
IF 6.931 (2021)
Bioinformatics
동기: 암의 분자적 특징을 더 잘 이해하기 위해, 다중 오믹스 데이터(multi-omics data)를 사용한 포괄적 분석을 수행하였다. 또한 여러 유전자 간의 통합적 효과를 용이하게 하기 위해 경로 활성 추론(pathway activity inference) 방법을 개발하였다. 이러한 맥락에서 우리는 최근 iDRW라는 새로운 통합 경로 활성 추론(integrative pathway activity inference) 접근법을 제안하였고, 두 개의 생존 집단을 이분화(dichotomizing)하는 데 있어 방법의 효과를 입증한 바 있다. 그러나 일반성(generality) 측면을 포함하여 몇 가지 한계가 존재하였다. 본 연구에서는 경로 정보를 이용해 여러 층(layer)으로 구성된 네트워크에서 유전자 간 상호작용을 부여함으로써 방향성을 갖는 유전자-유전자 그래프(directed gene-gene graph)를 설계하였다. 결과: 개념 증명(proof-of-concept) 연구로서, 비뇨기계(urologic) 암 환자의 세 가지 유전체 프로파일(genomic profiles)을 사용하여 평가하였다. 제안된 통합 접근법은 단일 유전체 프로파일만을 사용한 경우와 다른 기존의 경로 활성 추론 방법들과 비교하여, 향상된 결과 예측(outcome prediction) 성능을 달성하였다. 또한 통합 접근법은 비뇨기계 암에서 예측적 예후(prognostic) 특징으로서 공통적/암-특이적 후보 드라이버 경로(common/cancer-specific candidate driver pathways)를 확인하였다. 아울러 이는 다층 유전자-유전자 네트워크(multi-layered gene-gene network)를 이용한 통합 관점에서 우선순위가 부여된 경로와 유전자에 대한 더 나은 생물학적 통찰을 제공한다. 본 프레임워크는 비뇨기계 암에 특화되어 있지 않으며, 다양한 데이터셋에 대해 일반적으로 적용 가능하다. 가용성 및 구현: iDRW는 R 소프트웨어 패키지로 구현되었다. 소스 코드는 https://github.com/sykim122/iDRW 에서 제공된다. 보충 정보: 보충 데이터는 Bioinformatics online에서 이용 가능하다.
https://doi.org/10.1093/bioinformatics/btab086
Inference
Computer science
R package
Computational biology
Generality
Gene regulatory network
Biological network
Directed acyclic graph
Data mining
Gene