Data Intelligence Lab
컴퓨터소프트웨어학부 채동규
데이터 인텔리전스 연구실은 인공지능, 딥러닝, 머신러닝을 기반으로 다양한 데이터 분석 및 지능형 시스템 개발을 선도하는 연구실입니다. 본 연구실은 설명 가능한 인공지능(XAI), 시계열 데이터 분석, 자연어처리(NLP), 컴퓨터 비전, 그래프 신경망 등 첨단 AI 기술을 융합하여 실제 산업 및 사회 문제 해결에 기여하고 있습니다.
설명 가능한 인공지능 분야에서는 추천시스템, 반도체 공정, 의료, 시계열 데이터 등 다양한 도메인에 XAI를 적용하여, 모델의 의사결정 과정을 투명하게 설명하고 신뢰성을 확보하는 연구를 수행하고 있습니다. 특히, 컨셉 기반 설명, 불확실성 정량화, 인과관계 분석 등 최신 XAI 기법을 실제 산업 현장에 적용하여, 데이터 기반 의사결정의 신뢰성과 효율성을 높이고 있습니다.
시계열 데이터 분석 분야에서는 AI 기반 주가 예측, 장기 시계열 예측, 이상 탐지, 스마트 팩토리 장비 불량 예측 등 다양한 응용에 맞춘 혁신적인 분석 및 예측 기법을 개발하고 있습니다. 자기지도 학습, 그래프 신경망, 하이퍼그래프 등 최신 딥러닝 기술을 활용하여, 복잡한 시계열 패턴을 효과적으로 학습하고 예측하는 방법론을 제시하고 있습니다.
자연어처리 및 대규모 언어모델(LLM) 분야에서는 감성 분석, 문장 임베딩, 대조 학습, 다국어 및 방언 편향 분석, LLM 기반 챗봇 등 다양한 연구를 수행하고 있습니다. 특히, LLM의 신뢰성, 공정성, 안전성 평가와 실제 산업 현장 적용을 위한 실용적 기술 개발에 중점을 두고 있습니다.
컴퓨터 비전 및 멀티모달 인공지능 분야에서는 3D 객체 추적, 의료 영상 분석, 스마트 팩토리 비전, 멀티모달 데이터 융합 등 다양한 연구를 통해, 이미지와 영상 데이터를 효과적으로 분석하고 실제 문제 해결에 적용할 수 있는 첨단 기술을 개발하고 있습니다. 앞으로도 데이터 인텔리전스 연구실은 다양한 도메인에서의 AI 기술 융합과 실용화, 그리고 신뢰성 있는 인공지능 시스템 구축을 목표로 연구를 지속할 예정입니다.
Time-Series Analysis
Explainable AI
Natural Language Processing
설명 가능한 인공지능(XAI)
설명 가능한 인공지능(XAI)은 인공지능 모델의 의사결정 과정을 인간이 이해할 수 있도록 설명하는 기술을 연구하는 분야입니다. 본 연구실에서는 추천시스템, 반도체 공정 데이터, 시계열, 그래프, 의료 데이터 등 다양한 도메인에 XAI를 적용하여, 모델의 예측 근거와 불확실성, 신뢰성 있는 설명을 제공하는 방법론을 개발하고 있습니다. 특히, 컨셉 기반 설명, 베이지안 신경망, 불확실성 정량화 등 최신 XAI 기법을 실제 산업 현장에 적용하여, 복잡한 데이터와 모델의 해석 가능성을 높이고 있습니다.
연구실은 반도체 제조 공정과 같은 고난이도 산업 데이터에 XAI를 적용하여, 공정 변수의 인과관계 분석, 결함 탐지, 공정 최적화 등에 활용하고 있습니다. 또한, 의료 인공지능 분야에서는 의료 영상 및 생체 신호 데이터에 대한 설명 가능한 분석을 통해, 의료진이 신뢰할 수 있는 진단 지원 시스템을 구축하는 데 기여하고 있습니다. 이러한 연구는 실제 산업 파트너와의 협업을 통해 현장 적용성과 실효성을 검증받고 있습니다.
설명 가능한 인공지능 연구는 인공지능의 신뢰성과 투명성을 확보하는 데 필수적입니다. 본 연구실은 XAI의 이론적 발전뿐만 아니라, 실제 데이터와 문제에 적용 가능한 실용적 솔루션 개발에 중점을 두고 있습니다. 앞으로도 다양한 도메인에서의 XAI 적용을 확대하고, 인간-인공지능 협업 환경에서 신뢰할 수 있는 AI 시스템 구축을 목표로 연구를 지속할 예정입니다.
시계열 데이터 분석 및 이상 탐지
시계열 데이터 분석은 금융, 제조, 헬스케어, 스마트 팩토리 등 다양한 분야에서 시간에 따라 변화하는 데이터를 분석하고 예측하는 핵심 기술입니다. 본 연구실은 AI 기반 주가 예측, 장기 시계열 예측, 이상 탐지, 스마트 팩토리 장비 불량 예측, 그래프 기반 시계열 분석 등 다양한 시계열 데이터 분석 연구를 수행하고 있습니다. 특히, 자기지도 학습, 그래프 신경망, 하이퍼그래프, 트랜스포머 등 최신 딥러닝 기법을 활용하여 복잡한 시계열 패턴을 효과적으로 학습하고 예측하는 방법론을 개발하고 있습니다.
연구실은 실제 산업 현장에서 발생하는 결측치, 데이터 희소성, 다양한 시간 스케일 등 현실적인 문제를 해결하기 위한 데이터 증강, 결측치 보간, 다중 스케일 및 주파수 특징 융합 등 혁신적인 기술을 도입하고 있습니다. 또한, 시계열 데이터의 이상 탐지 분야에서는 그래프 기반의 이중 어텐션 네트워크, 모델 직렬화 기반 프레임워크 등 새로운 접근법을 통해 높은 정확도와 설명 가능성을 동시에 달성하고 있습니다.
이러한 연구는 스마트 팩토리, 반도체 공정, 금융 시장, 헬스케어 등 실제 응용 분야에서의 데이터 분석 및 예측 정확도 향상에 크게 기여하고 있습니다. 앞으로도 본 연구실은 시계열 데이터의 복잡성과 다양성을 극복하고, 실시간 모니터링 및 예측 시스템 구축을 위한 핵심 기술 개발에 주력할 계획입니다.
자연어처리 및 대규모 언어모델(LLM)
자연어처리(NLP)와 대규모 언어모델(LLM)은 인간의 언어를 이해하고 생성하는 인공지능의 핵심 분야입니다. 본 연구실은 감성 분석, 문장 임베딩, 대조 학습, OOD(Out-of-Distribution) 및 적대적 공격 탐지, 다국어 및 방언 편향 분석, 추천 시스템과의 융합 등 다양한 NLP 연구를 수행하고 있습니다. 특히, LLM 기반 챗봇, 문서 요약, 질의응답, 창의적 스토리텔링 등 실제 산업 및 사회 문제 해결에 직접 활용 가능한 기술 개발에 집중하고 있습니다.
연구실은 한국어, 벵골어, 말레이어 등 다양한 언어와 방언에 대한 편향 및 공정성 문제를 심층적으로 분석하고, 마스킹 언어모델, 대조 학습, 프롬프트 기반 데이터 증강 등 최신 기법을 적용하여 언어모델의 성능과 신뢰성을 높이고 있습니다. 또한, LLM의 정보 보존 특성, 응답 편향 완화, 안전성 평가 등 대규모 언어모델의 한계와 가능성에 대한 연구도 활발히 진행 중입니다.
이러한 연구는 공공 분야, 기업용 챗봇, 법률 문서 분석, 도시 데이터 질의 등 다양한 실제 프로젝트와 연계되어 실질적인 사회적 가치를 창출하고 있습니다. 앞으로도 본 연구실은 다국어, 멀티모달, 인간-인공지능 협업 환경에서의 자연어처리 기술 고도화와 LLM의 신뢰성·공정성 확보를 위한 연구를 지속적으로 확장할 예정입니다.
1
석박통합과정 Taki 학생의 논문 3편이 CSCW 2025에 모두 accept되었습니다 (short paper). TOP-TIERLLM
CSCW 2025, 2025.06
2
주식회사 메이크봇과 산학과제로 수행한 RAG기반 공공/기업용 챗봇 연구 (QA base를 사전 생성하여 답변 정확도와 속도 향상) 결과가 SIGIR 2025의 IR-RAG 워크샵에 accept되었습니다. LLM
SIGIR 2025 IR-RAG Workshop, 2025.06
3
석박통합과정 Taki 학생이 참여한 멀티모달 VLM 모델의 안전성 평가 벤치마크 논문이 ACL 2025에 accept되었습니다 (findings). TOP-TIERMultimodal
ACL 2025, 2025.05
1
[메이크봇] 공공분야에 특화된 sLLM 연구개발
2
[현대자동차] 길 안내 개인화 서비스를 위한 주행 데이터 기반 POI 추천시스템 개발
3
[연구재단] 초연결사회 위험 관리를 위한 빅데이터 기반 사회 환경 실시간 모니터링/사회 시뮬레이션 시스템