이화여자대학교
컴퓨터공학과 박현석
이화여자대학교 컴퓨터공학과 박현석 교수 연구실은 생물정보학, 인공지능, 자연언어처리 등 첨단 정보기술을 융합하여 바이오 및 의료 데이터 분석 분야에서 국내외적으로 선도적인 연구를 수행하고 있습니다. 연구실은 유전체, 단백질, 대사 경로 등 다양한 생명과학 데이터를 효율적으로 저장, 분석, 시각화하는 알고리즘과 소프트웨어를 개발하고, 이를 실제 생명과학 및 의학 문제 해결에 적용하는 데 주력하고 있습니다.
특히, 딥러닝과 머신러닝 기반의 의료 영상 분석, 암 진단 보조 시스템, COVID-19 등 감염병 유전체 데이터 분석, 그리고 후성유전체학 데이터의 언어학적 모델링 등 다양한 융합 연구를 통해, 정밀의료와 맞춤형 치료, 신약 개발 등 미래 의료 산업의 혁신을 이끌고 있습니다. 연구실은 CNN, Attention Mechanism, Ensemble Network 등 최신 인공지능 기술을 활용하여, 피부암, 유방암 등 다양한 질병의 조기 진단 및 예후 예측에 실질적으로 기여하고 있습니다.
또한, 자연언어처리와 텍스트 마이닝 기술을 접목하여, 대규모 바이오 논문, 특허, 임상 기록 등 비정형 텍스트 데이터에서 유의미한 생명과학 지식을 자동으로 추출하고, 이를 데이터베이스화하는 연구도 활발히 이루어지고 있습니다. 이러한 연구는 신약 후보 물질 탐색, 유전자-질병 연관성 분석, 바이오 특허 분석 등 다양한 바이오헬스 산업 분야에 실질적으로 활용되고 있습니다.
연구실은 클라우드 기반의 대규모 데이터 분석 플랫폼, 교육용 소프트웨어, 학습 관리 시스템(LMS) 등 실용적이고 혁신적인 도구 개발에도 앞장서고 있습니다. 이를 통해 차세대 생명정보 분석 인재 양성과 바이오 빅데이터 시대의 핵심 기술 개발에 기여하고 있습니다.
앞으로도 연구실은 인공지능과 빅데이터, 생물정보학의 융합을 통해 바이오헬스, 정밀의료, 디지털 헬스케어 등 미래 산업의 혁신을 선도하고, 학제 간 융합 연구와 산학협력을 통해 사회적 가치 창출에 앞장설 계획입니다.
Bioinformatics
Genomics
Big Data Analytics
생물정보학 및 유전체 데이터 분석
이화여자대학교 컴퓨터공학과 박현석 교수 연구실은 생물정보학(Bioinformatics) 분야에서 선도적인 연구를 수행하고 있습니다. 본 연구실은 대규모 유전체 데이터의 저장, 관리, 분석 및 시각화에 특화된 다양한 알고리즘과 소프트웨어 도구를 개발해왔습니다. 특히, DNA, RNA, 단백질 서열 데이터의 정렬, 어셈블리, 기능 예측 등 생명과학 데이터의 다양한 문제를 해결하기 위해 컴퓨터 과학적 방법론을 적극적으로 도입하고 있습니다.
최근에는 후성유전체학 데이터와 같은 비암호화 영역의 언어학적 모델링, 마코프 모델 및 기계학습 기반의 염기서열 패턴 분석, 그리고 대사 경로 및 신호전달 경로의 네트워크 분석 등 다양한 융합 연구가 활발히 이루어지고 있습니다. 이러한 연구는 유전체 내의 기능적 요소를 규명하고, 질병의 원인 유전자 및 바이오마커 발굴, 신약 개발 등에 실질적으로 기여하고 있습니다. 또한, 대규모 생물학 데이터의 효율적 처리를 위한 클라우드 기반 분석 플랫폼과 데이터베이스 구축에도 많은 노력을 기울이고 있습니다.
이 연구실은 국내외 다양한 협력 연구를 통해 생물정보학 분야의 학술적, 산업적 발전에 기여하고 있습니다. 다수의 특허와 국제 저널 논문, 그리고 교육용 소프트웨어 개발 경험을 바탕으로, 차세대 생명정보 분석 인재 양성과 바이오 빅데이터 시대의 핵심 기술 개발에 앞장서고 있습니다.
인공지능 기반 의료 데이터 분석 및 진단 지원
본 연구실은 인공지능(AI)과 딥러닝 기술을 활용한 의료 데이터 분석 및 진단 지원 시스템 개발에 집중하고 있습니다. 최근 발표된 논문에서는 피부암, 유방암 등 다양한 암 진단을 위한 딥러닝 기반 분류 및 분할 모델을 개발하여, 실제 임상 데이터에 적용 가능한 높은 정확도의 진단 보조 시스템을 제안하였습니다. 특히, CNN, Ensemble Network, Attention Mechanism 등 최신 딥러닝 기법을 활용하여 의료 영상 데이터의 특징을 효과적으로 추출하고, 데이터 불균형 문제를 해결하기 위한 데이터 증강 및 앙상블 전략을 적용하고 있습니다.
이러한 연구는 의료 현장에서의 조기 진단과 오진 감소, 환자 맞춤형 치료 전략 수립에 중요한 역할을 하고 있습니다. 예를 들어, 피부 병변의 자동 분할 및 분류, 유방암 영상의 감별 진단, COVID-19 DNA 서열의 국가별 분류 등 다양한 실제 문제에 AI 기술을 적용하여, 임상적 유용성과 신뢰성을 높이고 있습니다. 또한, 설명 가능한 인공지능(Explainable AI) 기법을 도입하여, 의료진이 AI의 판단 근거를 이해하고 신뢰할 수 있도록 지원하고 있습니다.
연구실은 앞으로도 빅데이터와 인공지능을 결합한 의료 데이터 분석의 새로운 패러다임을 제시하고, 의료 현장에 실질적으로 기여할 수 있는 혁신적 기술 개발에 매진할 계획입니다. 이를 통해 인공지능 기반 정밀의료, 디지털 헬스케어 등 미래 의료 산업의 핵심 주역으로 자리매김하고자 합니다.
자연언어처리 및 바이오텍스트 마이닝
연구실은 자연언어처리(NLP)와 텍스트 마이닝 기술을 바이오 및 의학 분야에 적용하는 연구를 활발히 수행하고 있습니다. 대규모 생명과학 논문, 특허, 임상 기록 등 비정형 텍스트 데이터를 분석하여, 유전자-질병 연관성, 단백질 상호작용, 신약 후보 물질 등 다양한 생물학적 지식을 자동으로 추출하는 시스템을 개발하고 있습니다. PubAnnotation, Named Entity Recognition, Word Embedding 등 최신 NLP 기법을 활용하여, 바이오텍스트의 의미적 구조와 패턴을 정밀하게 분석합니다.
특히, Genomics & Informatics 저널의 전체 논문을 대상으로 한 어노테이션 코퍼스 구축, PDF-to-Text 변환 오류 자동 교정, 생물학적 개체명 인식 및 관계 추출 등 실질적인 바이오텍스트 마이닝 응용 연구가 두드러집니다. 이러한 연구는 생명과학 지식의 데이터베이스화, 신약 개발을 위한 정보 탐색, 그리고 바이오 특허 분석 등 다양한 분야에 활용되고 있습니다. 또한, 번역 교육, 학습 관리 시스템(LMS) 개발 등 교육 현장에도 NLP 기술을 접목하여, 효율적인 교육 플랫폼 구축에도 기여하고 있습니다.
앞으로 연구실은 인공지능 기반의 고도화된 텍스트 마이닝 기술을 통해, 방대한 바이오메디컬 데이터에서 새로운 과학적 발견과 혁신적 응용을 이끌어낼 계획입니다. 이를 통해 바이오헬스 산업의 데이터 기반 혁신과 학제 간 융합 연구의 중심 역할을 수행하고자 합니다.
1
A Trustworthy Framework for Skin Cancer Detection Using a CNN with a Modified Attention Mechanism
APPLIED SCIENCES-BASEL, 2025
2
Attention-Based Ensemble Network for Effective Breast Cancer Classification over Benchmarks
Technologies, 2024
3
Country-Based COVID-19 DNA Sequence Classification in Relation with International Travel Policy
APPLIED SCIENCES-BASEL, 2024
2
딥러닝 기반 통역 및 외국어 학습의 딜리버리 평가 플랫폼 구축과 효용성 연구