Data Intelligence System Lab (DISLab)
산업및시스템공학과 송환준
DISLab(데이터 인텔리전스 시스템 연구실)은 인공지능 시스템 및 데이터 중심 AI 분야에서 선도적인 연구를 수행하는 연구실입니다. 본 연구실은 대규모 언어 모델, 컴퓨터 비전, 시계열 데이터 분석 등 다양한 인공지능 기술의 이론적 발전과 실제 응용을 목표로 하고 있습니다. 특히, 생성형 AI, 추천 시스템, 객체 탐지, 데이터 증류 및 압축, 연속 학습 등 최신 인공지능 트렌드에 맞춘 연구를 활발히 진행하고 있습니다.
연구실은 데이터 품질 향상, 노이즈 레이블 학습, 적응적 배치 선택, 모델 압축 및 경량화, 연속적 학습 환경에서의 성능 유지 등 실제 환경에서 발생하는 다양한 문제를 해결하기 위한 혁신적인 알고리즘을 개발하고 있습니다. 또한, 대규모 데이터셋 구축 및 자동화된 품질 평가 시스템 개발을 통해 인공지능 모델의 실용적 활용도를 극대화하고 있습니다. 이러한 연구는 의료, 과학기술, 산업 등 다양한 분야에 적용되어 사회적 가치를 창출하고 있습니다.
DISLab은 데이터 중심 인공지능(Data-centric AI) 패러다임을 선도적으로 연구하며, 데이터의 수집, 정제, 품질 평가, 통합 등 데이터 라이프사이클 전반에 걸쳐 인공지능 모델의 성능과 신뢰성을 높이기 위한 다양한 기술을 개발합니다. 특히, 실제 환경에서 발생하는 불완전하고 노이즈가 많은 데이터에 강인한 학습 방법론, 데이터 증류 및 합성, 데이터 기반 자동 평가 시스템 등 데이터 중심의 혁신적 접근법을 제시하고 있습니다.
생성형 AI와 RAG(Retrieval-Augmented Generation) 시스템 분야에서도 DISLab은 신뢰성 및 성능 향상에 중점을 두고 연구를 진행하고 있습니다. 도메인 특화 RAG 시스템의 데이터 구축, 최적화된 검색 및 생성 전략, 자동화된 평가 지표 개발 등 다양한 연구를 통해 도메인별로 특화된 고품질 AI 서비스를 제공하고 있습니다. 이를 통해 실제 산업 현장에서의 활용도를 높이고, 차세대 인공지능 기술 발전에 기여하고 있습니다.
DISLab은 국내외 유수의 기업 및 연구기관과의 협업을 통해 실제 문제 해결에 기여하고 있으며, 최신 논문 및 특허 출원을 통해 연구 성과를 지속적으로 확장하고 있습니다. 앞으로도 인공지능 시스템 및 데이터 중심 AI 분야에서 혁신적인 연구를 이어가며, 사회적·산업적 가치를 창출하는 연구실로 자리매김할 것입니다.
Continual Learning
Time-Series Anomaly Detection
Synthetic Data Generation
인공지능 시스템 및 응용
DISLab 연구실은 인공지능 시스템의 이론적 기반부터 실제 응용까지 폭넓은 연구를 수행하고 있습니다. 본 연구실은 대규모 언어 모델(LLM), 컴퓨터 비전, 시계열 데이터 분석 등 다양한 도메인에서 인공지능 기술을 개발하고, 이를 실제 산업 및 사회 문제 해결에 적용하는 데 중점을 두고 있습니다. 특히, 생성형 AI, 추천 시스템, 객체 탐지, 데이터 증류 및 압축, 연속 학습 등 최신 인공지능 트렌드에 맞춘 연구를 활발히 진행하고 있습니다.
연구실은 인공지능 모델의 신뢰성, 효율성, 확장성을 높이기 위한 다양한 방법론을 개발합니다. 예를 들어, 데이터 품질 향상, 노이즈 레이블 학습, 적응적 배치 선택, 모델 압축 및 경량화, 연속적 학습 환경에서의 성능 유지 등 실제 환경에서 발생하는 다양한 문제를 해결하기 위한 혁신적인 알고리즘을 제안하고 있습니다. 또한, 대규모 데이터셋 구축 및 자동화된 품질 평가 시스템 개발을 통해 인공지능 모델의 실용적 활용도를 극대화하고 있습니다.
이러한 연구는 산업 현장뿐만 아니라 의료, 교육, 과학기술 등 다양한 분야에 적용되어 사회적 가치를 창출하고 있습니다. DISLab은 국내외 유수의 기업 및 연구기관과의 협업을 통해 실제 문제 해결에 기여하고 있으며, 최신 논문 및 특허 출원을 통해 연구 성과를 지속적으로 확장하고 있습니다.
데이터 중심 인공지능 및 신뢰성 향상
DISLab은 데이터 중심 인공지능(Data-centric AI) 패러다임을 선도적으로 연구하고 있습니다. 데이터의 수집, 정제, 품질 평가, 통합 등 데이터 라이프사이클 전반에 걸쳐 인공지능 모델의 성능과 신뢰성을 높이기 위한 다양한 기술을 개발합니다. 특히, 실제 환경에서 발생하는 불완전하고 노이즈가 많은 데이터에 강인한 학습 방법론, 데이터 증류 및 합성, 데이터 기반 자동 평가 시스템 등 데이터 중심의 혁신적 접근법을 제시하고 있습니다.
연구실은 데이터 품질이 인공지능 모델의 성능에 미치는 영향을 심층적으로 분석하고, 데이터셋의 편향과 불공정성 문제를 해결하기 위한 알고리즘을 개발합니다. 또한, 데이터 중심의 평가 지표와 자동화된 품질 평가 시스템을 구축하여, 생성형 AI 및 대규모 언어 모델의 신뢰성, 완전성, 간결성, 가치 정렬(Value Alignment) 등을 정량적으로 평가하고 개선하는 연구를 수행합니다. 이를 통해 인공지능 모델이 실제 환경에서 더욱 신뢰성 있게 활용될 수 있도록 지원합니다.
이러한 데이터 중심 인공지능 연구는 의료, 과학기술, 산업 등 다양한 도메인에 특화된 AI 시스템 개발로 이어지고 있습니다. DISLab은 국내외 연구기관 및 산업체와의 협력을 통해 고품질 데이터셋 구축, 자동화된 평가 시스템 개발, 도메인 특화 RAG(Retrieval-Augmented Generation) 시스템 등 실질적이고 혁신적인 연구 성과를 창출하고 있습니다.
생성형 AI와 RAG(Retrieval-Augmented Generation) 시스템
DISLab은 생성형 인공지능(Generative AI)과 RAG(Retrieval-Augmented Generation) 시스템의 신뢰성 및 성능 향상에 중점을 두고 연구를 진행하고 있습니다. 생성형 AI는 대규모 언어 모델을 기반으로 텍스트, 이미지 등 다양한 데이터를 생성하는 기술로, 최근 산업 및 사회 전반에서 큰 주목을 받고 있습니다. 연구실은 생성형 AI의 핵심인 데이터 품질, 평가 지표, 편향 및 환각(hallucination) 문제 해결을 위한 혁신적인 방법론을 개발하고 있습니다.
특히, RAG 시스템은 외부 지식 기반의 정보 검색과 생성형 모델을 결합하여, 보다 정확하고 신뢰성 높은 응답을 생성할 수 있도록 지원합니다. DISLab은 과학기술, 의료, 수학 등 도메인 특화 RAG 시스템의 데이터 구축, 최적화된 검색 및 생성 전략, 자동화된 평가 지표 개발 등 다양한 연구를 수행하고 있습니다. 이를 통해 도메인별로 특화된 고품질 AI 서비스를 제공하고, 실제 산업 현장에서의 활용도를 높이고 있습니다.
이와 같은 연구는 국내외 연구기관 및 기업과의 공동 프로젝트, 특허 출원, 국제 학회 논문 발표 등 다양한 성과로 이어지고 있습니다. DISLab은 생성형 AI와 RAG 시스템의 신뢰성, 완전성, 가치 정렬 등 핵심 이슈를 해결함으로써, 차세대 인공지능 기술 발전에 기여하고 있습니다.
1
NLP Ext2Gen: Alignment through Unified Extraction and Generation for Robust Retrieval-Augmented Generation
Hwanjun Song*, Jeonghwan Choi, Minseok Kim (with Meta)
arXiv preprint arXiv:2503.04789, 2025
2
ReFeed: Multi-Dimensional Summarization Refinement with Reflective Reasoning on Feedback
Taewon Yun, Jihwan Oh, Hyangsuk Min, Yuho Lee, Jihwan Bang, Jason Cai, Hwanjun Song* (with Amazon)
Conference on Language Modeling, 2025
3
Robust Dataset Condensation using Supervised Contrastive Learning
Nicole Hee-Yeon Kim, Hwanjun Song*
International Conference on Computer Vision, 2025
1
과학기술정보 특화 LLM을 위한 RAG 지원 데이터 구축 (RAG-Supported Data Building for Scientific Information Specialized LLMs)
2
(통합EZ)과학기술정보 특화 LLM을 위한 RAG 지원 데이터 구축(2024년도)
3
(통합EZ)고품질 데이터 및 자동 품질 평가를 통한 언어 모델 신뢰성 향상 시스템(2024년도)