RnDCircle Logo

Data Science Lab

한양대학교 인공지능학과

정우환 교수

Financial Information Retrieval

Data Augmentation

Pretrained Language Models

Data Science Lab

인공지능학과 정우환

Data Science Lab은 한양대학교 ERICA캠퍼스 인공지능학과 소속으로, 인공지능의 핵심 분야인 자연어처리, 대형 언어 모델(LLM), 컴퓨터 비전, 멀티모달 인공지능 등 다양한 첨단 연구를 선도하고 있습니다. 본 연구실은 인간의 언어와 시각 정보를 이해하고 해석하는 기술을 바탕으로, 실제 산업 및 사회 문제 해결에 기여하는 혁신적 인공지능 솔루션을 개발하고 있습니다. 자연어처리 분야에서는 기계 번역, 질의 응답, 정보 검색, 대화형 에이전트 등 다양한 응용 분야에서 최신 딥러닝 및 LLM 기반 기술을 연구합니다. 특히, 금융, 법률, 의학 등 전문 도메인에 특화된 자연어처리 모델 개발과, LLM의 수치 환각(Hallucination) 현상 완화, 데이터 증강, 평가 지표 개선 등 실질적인 문제 해결에 집중하고 있습니다. 대형 언어 모델 및 에이전트 연구에서는 LLM의 구조적 개선, 비용-정확도 최적화, 도메인 특화 LLM 개발, 멀티 LLM 협업, 프라이버시 보호 등 다양한 기술적 도전과제를 다루고 있습니다. 또한, LLM 기반의 대화형 금융정보 검색, 특허 문서 작성, 음성 인식 등 실제 서비스에 적용 가능한 에이전트 시스템을 개발하고 있습니다. 컴퓨터 비전 및 멀티모달 인공지능 분야에서는 객체 검출, 시맨틱 분할, 이미지 인페인팅, 이미지 생성 등 다양한 비전 태스크와, 텍스트-음성-영상 등 멀티모달 데이터를 통합적으로 처리하는 모델 개발에 주력하고 있습니다. 태양광 모듈 결함 탐지, 의료 영상 분석 등 실제 산업 및 의료 현장에 적용 가능한 솔루션을 제시하며, 약한 지도 학습, 전이 학습, 반지도 학습 등 데이터 부족 문제 해결에도 앞장서고 있습니다. 이외에도, 본 연구실은 개인정보 보호, 데이터 마이닝, 지식 추출, 평가 지표 개발 등 다양한 인공지능 응용 연구를 수행하며, 국내외 유수 학회 및 산업체와의 협력을 통해 실질적이고 영향력 있는 연구 성과를 창출하고 있습니다. Data Science Lab은 첨단 인공지능 기술의 사회적 확산과 혁신을 선도하는 연구실로 자리매김하고 있습니다.

Financial Information Retrieval
Data Augmentation
Pretrained Language Models
자연어처리(Natural Language Processing)
자연어처리(Natural Language Processing, NLP)는 인간의 언어를 컴퓨터가 이해하고 해석하며, 이를 바탕으로 다양한 응용 서비스를 제공하는 핵심 인공지능 기술입니다. 본 연구실에서는 기계 번역, 질의 응답, 정보 검색, 대화형 에이전트 등 다양한 자연어처리 분야의 연구를 수행하고 있습니다. 특히, 금융, 법률, 의학 등 전문 도메인에 특화된 자연어처리 기술 개발에 주력하여, 실제 산업 현장에서 활용 가능한 고도화된 솔루션을 제시하고 있습니다. 최근에는 대규모 언어 모델(LLM)과 결합된 자연어처리 기술의 발전이 두드러지고 있습니다. 본 연구실은 LLM 기반의 텍스트 생성, 요약, 번역, 정보 추출 등 다양한 태스크에서 최신 딥러닝 모델을 적용하고, 데이터 증강, 평가 지표 개선, 수치 정보의 정확성 보장 등 실질적인 문제 해결에 집중하고 있습니다. 예를 들어, LLM이 생성하는 경제·금융 문서의 수치 환각(Hallucination) 현상을 완화하기 위한 숫자 매칭 기법, 고품질 번역 평가를 위한 새로운 평가 지표 개발 등 실제 문제에 밀접한 연구를 진행하고 있습니다. 또한, 본 연구실은 약한 지도 학습, 액티브 러닝, 데이터 증강 등 데이터 부족 문제를 해결하기 위한 다양한 방법론을 연구합니다. 이를 통해, 제한된 데이터 환경에서도 높은 성능을 발휘하는 자연어처리 모델을 개발하고 있으며, 실제 산업 및 사회적 요구에 부합하는 실용적 연구 성과를 창출하고 있습니다.
대형 언어 모델(LLMs) 및 에이전트 기술
대형 언어 모델(Large Language Models, LLMs)은 대규모 데이터로 학습되어 인간 수준의 언어 이해와 생성 능력을 갖춘 인공지능 모델입니다. 본 연구실은 LLM의 구조적 개선, 비용-정확도 최적화, 도메인 특화 LLM 개발 등 다양한 LLM 관련 연구를 수행하고 있습니다. 특히, OpenAI의 GPT 시리즈와 같은 최신 LLM을 활용하여, 실제 서비스에 적용 가능한 에이전트 기술과 자동화 시스템을 개발하는 데 주력하고 있습니다. LLM 기반 에이전트는 사용자의 질의 의도를 파악하고, 적절한 정보를 검색·생성하여 제공하는 대화형 시스템의 핵심입니다. 본 연구실은 금융정보 검색, 특허 문서 작성, 음성 인식 등 다양한 분야에 LLM 에이전트를 적용하고, 멀티 LLM 협업, 지식 결합, 수치 정보의 신뢰성 향상 등 실질적인 문제 해결에 집중하고 있습니다. 또한, LLM의 할루시네이션(환각) 현상 탐지 및 완화, 도메인 적합성 평가, 프롬프트 설계 등 LLM의 한계를 극복하기 위한 연구도 활발히 이루어지고 있습니다. 이와 더불어, LLM의 효율적 활용을 위한 계층적 질의 처리, 파인튜닝, 프라이버시 보호 등 다양한 기술적 도전과제를 다루고 있습니다. 본 연구실의 LLM 및 에이전트 연구는 실제 산업 현장과 사회적 요구에 부합하는 혁신적 인공지능 서비스 개발에 기여하고 있습니다.
컴퓨터 비전 및 멀티모달 인공지능
컴퓨터 비전(Computer Vision)은 이미지와 영상을 이해하고 해석하여, 시각적 데이터를 기반으로 유용한 정보를 추출하는 기술입니다. 본 연구실은 딥러닝 기반의 객체 검출, 시맨틱 분할, 이미지 인페인팅, 이미지 생성 등 다양한 컴퓨터 비전 분야의 연구를 수행하고 있습니다. 특히, 태양광 모듈 결함 탐지, 의료 영상 분석, 이미지 생성 및 편집 등 실제 산업 및 의료 현장에 적용 가능한 비전 솔루션 개발에 주력하고 있습니다. 최근에는 텍스트, 음성, 영상 등 다양한 데이터 유형을 결합하는 멀티모달 인공지능(Multi-modal AI) 연구가 활발히 이루어지고 있습니다. 본 연구실은 멀티모달 데이터를 효과적으로 처리할 수 있는 모델 구조 설계, 멀티모달 정보 융합, 비전-언어 모델(VLM) 개발 등 다양한 연구를 진행하고 있습니다. 이를 통해, 복잡한 현실 세계의 다양한 정보를 통합적으로 이해하고 활용할 수 있는 차세대 인공지능 기술을 개발하고 있습니다. 또한, 본 연구실은 데이터 부족, 라벨링 비용 문제를 해결하기 위한 약한 지도 학습, 전이 학습, 반지도 학습 등 다양한 학습 방법론을 비전 및 멀티모달 AI에 적용하고 있습니다. 실제 산업 현장에서 요구되는 고성능, 경량화, 프라이버시 보호 등 다양한 요구 사항을 만족하는 실용적 연구를 통해, 인공지능 기술의 사회적 확산과 혁신에 기여하고 있습니다.
1
Hierarchical Retrieval with Evidence Curation for Open-Domain Financial Question Answering on Standardized Documents
Jaeyoung Choe, Jihoon Kim, Woohwan Jung
Annual Meeting of the Association for Computational Linguistics (ACL Findings), 2025
2
Automatic Transmission for LLM Tiers: Optimizing Cost and Accuracy in Large Language Models
Injae Na, Keonwoong Noh, Woohwan Jung
Annual Meeting of the Association for Computational Linguistics (ACL Findings), 2025
3
CARE: A Framework for Correcting Numerical Hallucinations in LLM-Generated Financial Texts
Jian Kim, Woohwan Jung
IEEE Conference on Artificial Intelligence (CAI), 2025
1
전주기적 위암관리를 위한 인공지능기반 통합형 의사결정지원시스템 개발
보건복지부
2025년 04월 ~ 2025년 12월
2
개인정보보호를 보장하는 멀티모달 안티피싱을 위한 경량화 모델 및 스플릿러닝 기술 개발
과학기술정보통신부(2017Y)
2025년 ~ 2025년 12월
3
스마트 홈 기반 생활 케어 서비스 및 솔루션 개발
산업통상자원부
2024년 ~ 2025년 02월