DSAIL @ KAIST
산업및시스템공학과 박찬영
DSAIL 연구실은 KAIST 산업및시스템공학과 및 AI 대학원에 소속된 박찬영 교수의 지도 아래, 데이터 중심 인공지능(Data-centric AI)과 멀티모달 데이터 마이닝, 그래프 신경망(Graph Neural Networks) 등 첨단 인공지능 기술을 연구하고 있습니다. 최근 디지털 경제와 온라인 플랫폼의 확장으로 인해, 텍스트, 이미지, 그래프, 시계열 등 다양한 형태의 데이터가 폭발적으로 생성되고 있습니다. 이러한 데이터는 구조적 특성과 의미적 정보를 동시에 내포하고 있어, 효과적인 분석과 통합이 필수적입니다.
연구실은 멀티모달 데이터로부터 의미 있는 지식을 추출하고, 이를 다양한 실제 문제에 적용할 수 있는 인공지능 솔루션을 개발하는 데 중점을 두고 있습니다. 대표적으로 추천 시스템, 장면 이해, 소셜 네트워크 분석, 의료 영상 분석, 이상 탐지, 감정 분석, 구매/클릭 예측, 시계열 및 시공간 데이터 분석 등 다양한 응용 분야에서 연구 성과를 내고 있습니다. 특히, 그래프 신경망과 대규모 언어모델, 자기지도 학습, 설명 가능한 인공지능 등 최신 AI 기술을 적극적으로 도입하여, 데이터의 노이즈와 희소성, 불완전성 문제를 극복하고 있습니다.
또한, DSAIL 연구실은 과학 분야의 실제 문제 해결에도 큰 기여를 하고 있습니다. 분자 설계 및 신약 개발, 단일세포 RNA 시퀀싱 데이터 분석, 미생물-질병 연관성 예측, 재료과학 및 화학 분야의 데이터 기반 예측 등 다양한 과학적 문제에 인공지능과 데이터 마이닝 기법을 적용하여 혁신적인 연구를 수행하고 있습니다. 이러한 연구는 과학적 발견의 효율성과 정확성을 높이고, 산업 및 의료, 바이오 분야의 실질적인 발전에 기여하고 있습니다.
연구실은 국내외 주요 학회 및 저널에 다수의 논문을 발표하고, 다양한 산학협력 및 국가 연구과제를 수행하며, KAIST 내외의 우수한 인재들과 함께 활발한 연구 활동을 이어가고 있습니다. 또한, 데이터 기반 의사결정의 신뢰성과 투명성을 높이기 위한 설명 가능한 인공지능, 강건한 학습, 연속 학습 등 미래지향적 연구도 적극적으로 추진하고 있습니다.
DSAIL 연구실은 멀티모달 데이터와 인공지능의 융합을 통해 새로운 지식 발견과 혁신적 응용을 선도하며, 데이터사이언스와 인공지능 분야의 글로벌 리더로 자리매김하고 있습니다.
miRNA-disease Associations
Single-cell RNA Sequencing
Graph Representation Learning
멀티모달 데이터 마이닝과 통합 인공지능 솔루션 개발
DSAIL 연구실은 다양한 형태의 데이터를 통합적으로 분석하여 의미 있는 지식을 추출하는 멀티모달 데이터 마이닝에 중점을 두고 있습니다. 최근 소셜 미디어, 온라인 커뮤니티, 전자상거래 등 다양한 플랫폼에서 생성되는 데이터는 텍스트, 이미지, 그래프, 시계열 등 여러 형태로 존재하며, 이들 데이터를 효과적으로 결합하고 분석하는 것은 매우 도전적인 과제입니다. 연구실은 이러한 멀티모달 데이터를 통합적으로 표현하고, 각 데이터 간의 관계와 시너지를 극대화하는 방법론을 개발하고 있습니다.
특히, 그래프 신경망(Graph Neural Networks), 대규모 언어모델(Large Language Models), 딥러닝 기반의 표현 학습(Representation Learning) 등 첨단 인공지능 기술을 활용하여, 데이터의 구조적 특성과 의미적 정보를 동시에 포착하는 연구를 수행합니다. 이를 통해 추천 시스템, 장면 이해, 소셜 네트워크 분석, 의료 영상 분석 등 다양한 실제 문제에 적용 가능한 인공지능 솔루션을 개발하고 있습니다. 또한, 데이터의 노이즈와 불완전성, 희소성 문제를 극복하기 위한 강건한 학습 기법과 설명 가능한 인공지능(Explainable AI) 연구도 병행하고 있습니다.
이러한 연구는 산업 및 사회 전반에 걸쳐 데이터 기반 의사결정의 정확성과 신뢰성을 높이는 데 기여하고 있습니다. DSAIL 연구실은 멀티모달 데이터의 통합 분석을 통해 새로운 지식 발견과 혁신적 인공지능 응용을 선도하고 있으며, 다양한 도메인에서 실질적인 임팩트를 창출하고 있습니다.
그래프 신경망 및 데이터 중심 인공지능의 과학 응용
DSAIL 연구실은 그래프 신경망(Graph Neural Networks, GNN)과 데이터 중심 인공지능(Data-centric AI)을 기반으로 과학 분야의 다양한 문제를 해결하는 데 주력하고 있습니다. 그래프 신경망은 복잡한 관계 구조를 가진 데이터(예: 분자 구조, 생명정보, 소셜 네트워크 등)를 효과적으로 모델링할 수 있는 강력한 도구로, 최근 화학, 바이오인포매틱스, 재료과학 등 다양한 과학 분야에서 그 활용도가 급격히 증가하고 있습니다.
연구실은 분자 설계 및 신약 개발, 단일세포 RNA 시퀀싱 데이터 분석, 미생물-질병 연관성 예측 등 생명과학 및 화학 분야의 실제 문제에 그래프 신경망과 딥러닝 기법을 적용하고 있습니다. 예를 들어, 단일세포 RNA 데이터의 노이즈 제거 및 클러스터링, 미생물-질병 연관성 예측을 위한 행렬 완성 및 네트워크 정규화, 분자 구조-물성 예측을 위한 멀티모달 트랜스포머 등 다양한 연구 성과를 내고 있습니다. 또한, 데이터의 희소성과 불균형 문제를 극복하기 위한 자기지도 학습(Self-supervised Learning) 및 연속 학습(Continual Learning) 기법도 활발히 연구되고 있습니다.
이러한 연구는 과학적 발견의 효율성과 정확성을 크게 높이며, 신약 개발, 재료 설계, 유전체 분석 등 다양한 분야에서 혁신적인 성과를 이끌어내고 있습니다. DSAIL 연구실은 데이터 중심 인공지능과 그래프 신경망의 융합을 통해 과학적 문제 해결의 새로운 패러다임을 제시하고 있습니다.
1
Deep single-cell RNA-seq data clustering with graph prototypical contrastive learning
Bioinformatics, 2023
2
Single-cell RNA Sequencing Data Imputation Using Bi-level Feature Propagation
Junseok Lee*, Sukwon Yun*, Yeongmin Kim, Tianlong Chen, Manolis Kellis, Chanyoung Park
Briefings in Bioinformatics, 2024
3
Deep Single-cell RNA-seq Data Clustering with Graph Prototypical Contrastive Learning
Junseok Lee, Sungwon Kim, Dongmin Hyun, Namkyeong Lee, Yejin Kim, Chanyoung Park
Bioinformatics, 2023
1
(통합EZ)그래프 파운데이션 모델: 다양한 모달리티 및 도메인에적용 가능한 그래프 기반 기계 학습(2024년도)
2
(통합EZ)그래프 빅데이터를 위한 파운데이션 모델 개발(2024년도)
3
(통합EZ)강건하고 공정하며 확장 가능한 데이터 중심의 연속 학습(2024년도)