RnDCircle Logo

HUMANE Lab

숭실대학교 AI융합학부

박건우 교수

Multimodal Detection

Natural Language Processing

Hate Speech Detection

HUMANE Lab

AI융합학부 박건우

HUMANE Lab은 인공지능 융합 분야에서 자연어처리와 멀티모달 데이터 분석을 중심으로 다양한 연구를 수행하는 연구실입니다. 본 연구실은 특히 뉴스 및 소셜 미디어 데이터를 대상으로 한 자동화 팩트체킹, 신뢰성 검증, 입장 탐지, 이미지-텍스트 일치성 판별 등 사회적으로 중요한 문제 해결에 집중하고 있습니다. 최근에는 대규모 언어 모델(LLM)과 최신 딥러닝 기술을 활용하여, 뉴스 기사와 소셜 미디어 포스트의 사실 여부를 자동으로 검증하는 시스템 개발에 주력하고 있습니다. 팩트체킹 벤치마크 데이터셋 구축, 대조학습 기반의 팩트체킹 모델, 검색 증강 생성(RAG) 기법 등 다양한 방법론을 적용하여 실제 언론 현장과 플랫폼에서 활용 가능한 기술을 연구하고 있습니다. 또한, HUMANE Lab은 텍스트와 이미지를 결합한 멀티모달 뉴스 분석에도 앞장서고 있습니다. CLIP 등 멀티모달 딥러닝 모델을 활용하여 뉴스 기사 본문과 대표 이미지 간의 의미적 일치성, 대표성, 오용 여부를 자동으로 판별하는 기술을 개발하고 있으며, 다국어 환경에서의 이미지-텍스트 매칭, 썸네일 대표성 평가 등 다양한 응용 연구를 진행하고 있습니다. 이 외에도, 자연어처리 모델의 예측 편향 분석, 데이터 증강 기법, 소셜 미디어 내 정보 흐름 분석, 온라인 커뮤니티 내 사용자 행동 연구 등 데이터사이언스와 인공지능의 다양한 응용 분야를 폭넓게 다루고 있습니다. 이러한 연구는 사회적으로 신뢰할 수 있는 정보 유통 환경을 조성하고, 언론사, 플랫폼, 일반 사용자 모두에게 실질적인 도움을 주는 것을 목표로 하고 있습니다. HUMANE Lab은 앞으로도 인공지능과 데이터사이언스의 융합을 통해, 디지털 미디어 환경에서의 정보 신뢰성 향상과 허위 정보 확산 억제에 기여하는 혁신적인 연구를 지속적으로 추진할 계획입니다.

Multimodal Detection
Natural Language Processing
Hate Speech Detection
자동화 팩트체킹 및 뉴스 신뢰성 검증
HUMANE Lab은 자동화 팩트체킹과 뉴스 신뢰성 검증 분야에서 선도적인 연구를 수행하고 있습니다. 최근 언론 환경에서는 허위 정보와 가짜 뉴스가 사회적으로 큰 문제로 대두되고 있으며, 이에 따라 신뢰할 수 있는 정보의 자동 판별 기술이 필수적으로 요구되고 있습니다. 본 연구실은 대규모 언어 모델(LLM)과 최신 자연어처리(NLP) 기법을 활용하여 뉴스 기사, 소셜 미디어 포스트 등 다양한 텍스트 데이터의 사실 여부를 자동으로 검증하는 시스템을 개발하고 있습니다. 연구실에서는 팩트체킹 벤치마크 데이터셋 구축, 대조학습 기반의 팩트체킹 모델 개발, 검색 증강 생성(RAG) 기법을 적용한 검증 프레임워크 등 다양한 연구를 진행하고 있습니다. 특히, 한국어를 포함한 다국어 환경에서의 팩트체킹 자동화, 뉴스 본문과 헤드라인 간의 불일치 탐지, 인용구 및 발언의 맥락 기반 입장 탐지 등 실제 언론 현장에서 활용 가능한 기술 개발에 집중하고 있습니다. 또한, 최신 논문에서는 대규모 언어 모델의 팩트 검증 능력에 대한 심층 평가와 ChatGPT, PaLM 2 등 최신 AI 모델의 성능 분석도 활발히 이루어지고 있습니다. 이러한 연구는 사회적으로 신뢰할 수 있는 정보 유통 환경을 조성하는 데 기여하며, 언론사, 플랫폼, 일반 사용자 모두에게 실질적인 도움을 제공합니다. 앞으로 HUMANE Lab은 팩트체킹 자동화의 정확도와 효율성을 높이고, 다양한 언어와 미디어 환경에 적용 가능한 범용적 기술 개발을 목표로 하고 있습니다.
멀티모달 뉴스 분석 및 이미지-텍스트 일치성 탐지
HUMANE Lab은 텍스트와 이미지를 결합한 멀티모달 뉴스 분석 연구에도 집중하고 있습니다. 현대 뉴스 기사에서는 텍스트뿐만 아니라 대표 이미지, 썸네일 등 다양한 시각적 요소가 함께 제공되며, 이들 간의 일치성 및 신뢰성 검증이 중요한 이슈로 떠오르고 있습니다. 본 연구실은 CLIP 등 최신 멀티모달 딥러닝 모델을 활용하여 뉴스 기사 본문과 대표 이미지 간의 의미적 일치성, 대표성, 그리고 오용 여부를 자동으로 판별하는 기술을 개발하고 있습니다. 구체적으로, 다국어 환경에서의 이미지-텍스트 매칭, 뉴스 썸네일의 대표성 평가, 가짜 뉴스에서의 이미지 오용 탐지 등 다양한 응용 연구가 진행되고 있습니다. 또한, 대조학습(contrastive learning) 기반의 임베딩 프레임워크를 통해 텍스트와 이미지의 의미적 유사성을 정량적으로 측정하고, 실제 뉴스 기사에서 발생하는 이미지-텍스트 불일치 사례를 체계적으로 분석합니다. 이러한 연구는 뉴스 소비자에게 보다 신뢰할 수 있는 정보를 제공하고, 언론사의 신뢰도 향상에도 기여할 수 있습니다. 향후 HUMANE Lab은 멀티모달 데이터의 융합 분석을 더욱 고도화하여, 뉴스뿐만 아니라 다양한 소셜 미디어, 온라인 커뮤니티 등으로 연구 범위를 확장할 계획입니다. 이를 통해 정보의 신뢰성과 투명성을 높이고, 디지털 미디어 환경에서의 허위 정보 확산을 효과적으로 억제하는 데 기여하고자 합니다.
1
Journalism-Guided Agentic In-Context Learning for News Stance Detection
Dahyun Lee, Jonghyeon Choi, Jiyoung Han, Kunwoo Park
, 2025
2
Team HUMANE at AVeriTeC 2025: HerO 2 for Efficient Fact Verification
Yejun Yoon, Jaeyoon Jung, Seunghyun Yoon, Kunwoo Park
, 2025
3
Hypothetical Documents or Knowledge Leakage? Rethinking LLM-based Query Expansion
Yejun Yoon, Jaeyoon Jung, Seunghyun Yoon, Kunwoo Park
, 2025
1
정보통신기획평가원 지역지능화혁신인재양성사업
정보통신기획평가원
2
지능형반도체 기반 고효율 자율형 IoT 디바이스 교육연구단 (BK21 FOUR)
한국연구재단