DMIS Lab
컴퓨터학과 강재우
DMIS 연구실(데이터마이닝 및 정보시스템 연구실)은 데이터 통합, 대규모 정보시스템, 바이오메디컬 인공지능, 자연어처리, 그래프 머신러닝 등 첨단 컴퓨터 과학 및 인공지능 분야에서 세계적인 연구를 수행하고 있습니다. 연구실은 수십억 개에 달하는 이질적 데이터 소스를 통합하고, 복잡한 질의에 신속하게 응답할 수 있는 대규모 분산 정보시스템을 개발하여, 다양한 도메인에서 데이터 기반 의사결정의 혁신을 이끌고 있습니다.
특히, 바이오메디컬 도메인에서는 자연어처리와 인공지능 기술을 융합하여, 대규모 바이오메디컬 문헌 및 임상 데이터를 자동으로 분석하고, 신약 개발, 정밀의료, 시스템 생물학 등 다양한 응용 분야에 기여하고 있습니다. 대표적으로, 연구실이 개발한 BioBERT는 바이오메디컬 자연어처리 분야의 표준 모델로 자리잡았으며, 개체명 인식, 관계 추출, 질의응답 등 다양한 과제에서 탁월한 성과를 거두었습니다.
그래프 기반 머신러닝 및 딥러닝 연구도 활발히 진행되고 있습니다. 연구실은 그래프 신경망, 그래프 트랜스포머, 그래프 임베딩 등 최신 기법을 개발하여, 화합물-단백질 상호작용 예측, 약물 반응성 분석, 유전자 네트워크 해석 등 신약 개발과 생명과학 분야의 복잡한 문제를 해결하고 있습니다. 이러한 연구는 실제 제약 산업 및 의료 현장에서 신약 후보물질 발굴, 약물 작용 기전 예측, 환자 맞춤형 치료 전략 수립 등에 실질적으로 활용되고 있습니다.
DMIS 연구실은 국내외 최고 수준의 연구 성과를 바탕으로, BioASQ, DREAM Challenge 등 국제 대회에서 다수의 수상 경력을 보유하고 있습니다. 또한, 다양한 산학협력 및 국가 연구과제를 수행하며, 학계와 산업계 모두에 실질적인 가치를 제공하고 있습니다.
앞으로도 DMIS 연구실은 데이터사이언스, 인공지능, 바이오메디컬 AI, 그래프 머신러닝 등 첨단 융합 연구를 통해, 데이터 기반의 혁신적 솔루션을 제시하고, 미래 사회의 다양한 문제 해결에 앞장설 것입니다.
Graph Attention Networks
Biomedical Question Answering
Drug-Target Binding Affinity Prediction
대규모 이질적 데이터 통합 및 정보시스템
DMIS 연구실은 수십억 개에 달하는 이질적 데이터 소스를 통합하여 복잡한 질의에 효과적으로 응답할 수 있는 대규모 정보시스템 구축에 주력하고 있습니다. 이러한 시스템은 데이터 통합, 웹 데이터 마이닝, 인터넷 규모의 분산 시스템, 대규모 데이터 분석 등 다양한 컴퓨터 과학 분야의 핵심 기술을 융합하여 실현됩니다. 연구실은 데이터의 다양성과 복잡성, 그리고 실시간 처리 요구를 해결하기 위해 고성능 분산 컴퓨팅 아키텍처와 효율적인 질의 처리 알고리즘을 개발하고 있습니다.
특히, 이질적 데이터 소스 간의 스키마 매칭, 데이터 정합성 확보, 대용량 데이터의 실시간 분석 등 실질적인 문제 해결에 초점을 맞추고 있습니다. 이를 위해 정보이론 기반의 스키마 매칭, 그래프 기반 데이터 표현, 그리고 최신 딥러닝 기법을 활용한 데이터 통합 방법론을 연구합니다. 또한, 웹에서 수집되는 비정형 데이터와 구조화된 데이터의 통합을 위한 자동화된 파이프라인을 구축하여, 다양한 도메인에서 활용 가능한 범용 정보시스템을 지향합니다.
이러한 연구는 생명과학, 의학, 금융 등 다양한 분야의 대규모 데이터 활용을 가능하게 하며, 복잡한 질의에 대한 신속하고 정확한 응답을 제공함으로써 데이터 기반 의사결정의 혁신을 이끌고 있습니다. 앞으로도 DMIS 연구실은 데이터 통합 및 대규모 정보시스템 분야에서 세계적인 연구 성과를 지속적으로 창출할 계획입니다.
바이오메디컬 인공지능 및 자연어처리
DMIS 연구실은 바이오메디컬 인공지능(AI)과 자연어처리(NLP) 분야에서 세계적인 연구를 선도하고 있습니다. 대표적으로, 대규모 바이오메디컬 텍스트를 대상으로 한 사전학습 언어모델 BioBERT를 개발하여, 바이오메디컬 도메인에서의 개체명 인식(NER), 관계 추출, 질의응답 등 다양한 자연어처리 과제에서 탁월한 성능을 입증하였습니다. BioBERT는 2,400회 이상의 인용과 함께 2020년 IMIA Yearbook에서 최고의 논문으로 선정되는 등, 바이오메디컬 NLP 분야의 표준으로 자리매김하였습니다.
연구실은 바이오메디컬 문헌에서 유의미한 정보를 자동으로 추출하고, 이를 기반으로 신약 개발, 정밀의료, 시스템 생물학 등 다양한 바이오메디컬 응용에 기여하고 있습니다. 예를 들어, 바이오메디컬 개체명 인식, 관계 추출, 질의응답 시스템, 신약 후보물질 발굴, 약물-단백질 상호작용 예측 등 다양한 연구가 활발히 진행되고 있습니다. 또한, 대규모 언어모델을 활용한 의료 질의응답, 임상 문서 분석, 환자 맞춤형 치료 전략 수립 등 실제 의료 현장에 적용 가능한 AI 솔루션 개발에도 집중하고 있습니다.
이와 같은 연구는 바이오메디컬 데이터의 폭발적 증가에 대응하여, 인간 전문가의 한계를 극복하고, 데이터 기반의 혁신적 의료 및 생명과학 연구를 가능하게 합니다. 앞으로도 DMIS 연구실은 바이오메디컬 AI와 NLP 분야에서 새로운 이정표를 제시하며, 학계와 산업계 모두에 실질적인 가치를 제공할 것입니다.
그래프 머신러닝 및 신약 개발 응용
DMIS 연구실은 그래프 구조 기반의 머신러닝(Graph ML)과 이를 활용한 신약 개발, 정밀의료, 시스템 생물학 등 다양한 응용 분야에서 혁신적인 연구를 수행하고 있습니다. 그래프 신경망(GNN), 그래프 트랜스포머, 그래프 임베딩 등 최신 그래프 기반 딥러닝 기법을 개발하여, 화합물-단백질 상호작용 예측, 약물 반응성 분석, 유전자 네트워크 해석 등 복잡한 생명현상과 약물 작용 메커니즘을 정량적으로 모델링합니다.
특히, 신약 개발 분야에서는 3차원 분자 구조 정보와 생물학적 특성을 통합적으로 분석하여, 새로운 약물 후보물질을 효율적으로 발굴하고, 약물의 작용 기전과 부작용을 예측하는 연구가 활발히 이루어지고 있습니다. 예를 들어, Perceiver CPI, ArkDTA, MolPLA 등 혁신적인 그래프 기반 모델을 통해 약물-단백질 결합 친화도 예측, 약물 반응성 유사도 분석, 유전자 발현 기반 약물 작용 기전 예측 등 다양한 성과를 내고 있습니다.
이러한 연구는 실제 제약 산업 및 정밀의료 분야에서 신약 개발의 효율성과 성공률을 높이고, 환자 맞춤형 치료 전략 수립에 기여합니다. 앞으로도 DMIS 연구실은 그래프 머신러닝과 생명과학의 융합을 통해, 데이터 기반의 혁신적 바이오메디컬 솔루션을 지속적으로 제시할 계획입니다.
1
Consistency Training with Virtual Adversarial Discrete Perturbation
, 2022
2
FAVIQ: FAct Verification from Information-seeking Questions
, 2022
3
MSTR: Multi-Scale Transformer for End-to-End Human-Object Interaction Detection
Bumsoo Kim, Junhyun Lee
, 2022
1
생명의료 가설 Co-Design을 위한 Human-in-the-loop 초대형 언어모델 개발
2
바이오 빅데이터 기반 당뇨병 및 합병증 정밀 의료를 위한 AI 플랫폼 및 모델 개발
3
사용자들의 다양한 관심사 맞춤형 문화유산 스토리텔링 AI 기술 개발