연구실에서 최근에 진행되고 있는 관심 연구 분야
1
자연어처리(NLP) 및 대화시스템
DAI Lab은 자연어처리(NLP) 분야에서 다양한 연구를 수행하고 있습니다. 특히 챗봇, 대화시스템, 정보 추출 등 인간과 컴퓨터 간의 자연스러운 상호작용을 위한 핵심 기술 개발에 집중하고 있습니다. 연구실은 한국어뿐만 아니라 저자원 언어(예: 아프리카 언어)까지 다양한 언어에 대한 토크나이저 개발, 도메인 적응 언어모델 사전학습, 시간 정보 추출, 감성 분석 등 폭넓은 주제를 다루고 있습니다. 최근에는 대규모 언어모델(LLM)과 트랜스포머 기반의 최신 딥러닝 모델을 활용하여, 문장 내 시간 정보, 감정, 의도, 도메인 분류 등 복합적인 자연어 이해 과제를 해결하고 있습니다. 또한, 멀티태스크 학습, 전이학습, 앙상블 모델 등 다양한 기계학습 기법을 적용하여 실제 서비스에 적용 가능한 높은 성능의 모델을 개발하고 있습니다. 이 과정에서 산업 및 직업 코드 자동 분류, 정책 여론 분석, 사회적 이슈 감성 분석 등 실질적인 사회 문제 해결에도 기여하고 있습니다. 연구실의 NLP 연구는 다수의 국내외 저널 및 학회 논문, 특허, 정부 및 산업체 과제와도 긴밀히 연계되어 있습니다. 실제 데이터셋 구축, 모델 배포, 실증 서비스 개발 등 실용적 성과를 창출하고 있으며, 앞으로도 인간 중심의 지능형 언어처리 기술 고도화에 앞장설 계획입니다.
2
딥러닝 기반 악성코드 탐지 및 보안
DAI Lab은 딥러닝 및 기계학습을 활용한 악성코드 탐지와 보안 분야에서도 선도적인 연구를 수행하고 있습니다. 특히 한글(HWP), PDF 등 문서형 파일을 대상으로 한 악성코드 탐지에 특화된 모델을 개발하고 있으며, 트랜스포머, CNN, GAN 등 최신 딥러닝 아키텍처를 적용하여 높은 탐지 정확도를 달성하고 있습니다. 기존의 실행파일 중심 보안 연구와 달리, 문서형 악성코드의 특성을 반영한 스트림 분석, 바이트 단위 특징 추출, 자동 태깅 및 군집화 등 차별화된 접근법을 제시하고 있습니다. 연구실은 실제 악성코드 샘플 수집 및 대규모 데이터셋 구축, 실시간 탐지 시스템 개발, 클래스 불균형 문제 해결 등 실무적 난제에 대한 해결책을 제시하고 있습니다. 또한, 생성적 적대 신경망(GAN)을 활용한 악성코드 샘플 생성, 언어모델 기반 코드 임베딩, 다양한 파일 포맷 간 상호 학습 등 혁신적인 연구를 통해 보안 분야의 새로운 패러다임을 제시하고 있습니다. 이러한 연구 결과는 국내외 저명 학술지 및 특허로도 이어지고 있으며, 실제 산업체와의 협력 과제도 활발히 진행 중입니다. 향후 연구실은 사이버전장 방어체계, 실시간 문서형 악성코드 분석, AI 기반 보안 자동화 등 미래 보안 환경에 대응하는 첨단 기술 개발에 더욱 박차를 가할 예정입니다. 이를 통해 사회 전반의 정보보호 수준 향상과 안전한 디지털 환경 조성에 기여하고자 합니다.
3
의료 및 제약 데이터 분석과 예측
DAI Lab은 임상 데이터, 약학 데이터 등 의료 및 제약 분야의 빅데이터 분석과 예측 모델 개발에도 활발히 참여하고 있습니다. 응급상황 예측, 수술 후 합병증 예측, 약물의 물리적 안정성 예측, 신약 후보 물질 발굴 등 다양한 의료·제약 응용 문제를 해결하기 위해 딥러닝, 그래프 신경망(GNN), BERT 등 최신 AI 기술을 접목하고 있습니다. 특히, 분자 구조를 나타내는 SMILES 데이터의 텍스트 분석, 약물-코포머 상호작용 예측, COVID-19 및 말라리아 등 감염병 치료제 후보 예측 등에서 혁신적인 성과를 내고 있습니다. 데이터 불균형, 소규모 데이터셋, 복잡한 분자 관계 등 의료·제약 데이터의 특수성을 반영한 맞춤형 모델링 기법을 개발하고, 실제 임상 및 제약 현장에 적용 가능한 솔루션을 제시하고 있습니다. 이러한 연구는 국내외 의료기관, 제약사, 정부기관과의 협력 과제 및 다수의 SCI급 논문, 특허로 이어지고 있습니다. 앞으로도 DAI Lab은 인공지능 기반의 정밀의료, 신약 개발, 임상 의사결정 지원 등 첨단 바이오헬스 분야의 혁신을 선도할 계획입니다.