Natural Language Processing Lab
컴퓨터공학부 김학수
건국대학교 자연어처리 연구실(NLP Lab)은 컴퓨터공학부 소속으로, 자연어처리 분야에서 국내외적으로 선도적인 연구를 수행하고 있습니다. 연구실은 거대 언어 모델(LLM)의 신뢰성, 윤리성, 최신성 확보를 위한 기술 개발에 집중하고 있으며, 환각(Hallucination) 현상 탐지 및 완화, 지식 편집, 윤리적 응답 생성 등 LLM의 한계를 극복하기 위한 다양한 연구를 진행하고 있습니다. 이러한 연구는 생성AI의 사회적 책임과 실용적 활용을 동시에 고려하는 첨단 분야로, 국가적 연구과제와도 긴밀하게 연계되어 있습니다.
또한, 연구실은 한국어 자연어처리의 핵심 기술인 형태소 분석, 개체명 인식, 구문 분석 등에서 오랜 기간 축적된 연구 경험과 기술력을 보유하고 있습니다. 최신 딥러닝 기법을 활용한 통합 모델 개발, 중첩 개체명 인식, 품사 태깅, 의존 구문 분석 등 다양한 세부 연구를 통해 한국어의 복잡한 언어 구조를 효과적으로 처리할 수 있는 솔루션을 제공하고 있습니다. 이와 같은 연구 성과는 실제 산업 현장과 학계에 널리 활용되고 있으며, 관련 특허와 소프트웨어 도구도 다수 개발되었습니다.
연구실은 대화형 인공지능 시스템 개발에도 큰 강점을 가지고 있습니다. 생성 기반 챗봇, 기계독해(MRC), 대화형 질의응답 시스템, 문서 요약, 페르소나 챗봇 등 다양한 대화형 AI 모델을 개발하여 실제 서비스에 적용하고 있습니다. 특히, KACTEIL-Book Reading Bot, KACTEIL-MRC 등은 실용성과 기술적 완성도를 동시에 갖춘 대표적인 연구 성과입니다. 대화 데이터의 노이즈 제거, 멀티턴 대화, 감정 및 의도 인식 등 실제 서비스에서 요구되는 고도화된 기능 개발에도 적극적으로 참여하고 있습니다.
이외에도 연구실은 정보검색, 감성분석, 관계 추출, 문서 분류 등 자연어처리의 다양한 응용 분야에서 활발한 연구를 수행하고 있습니다. 다수의 국내외 학술대회 및 저널에 논문을 발표하고, 특허 출원 및 등록, 산학협력 프로젝트 수행 등 실질적인 연구성과를 지속적으로 창출하고 있습니다. 또한, 인공지능의 사회적 책임과 윤리적 활용을 위한 데이터 특성 분석, 설명가능 인공지능(XAI) 등 미래지향적 연구도 병행하고 있습니다.
연구실은 앞으로도 인간 중심의 범용 인공지능, 신뢰성과 윤리성을 갖춘 생성AI, 한국어 및 다국어 자연어처리 기술의 고도화를 목표로 연구를 지속할 예정입니다. 이를 통해 학문적 기여뿐만 아니라, 산업 및 사회 전반에 긍정적인 영향을 미치는 연구실로 자리매김하고자 합니다.
Chatbot Development
Machine Reading Comprehension
Deep Learning for NLP
거대 언어 모델(LLM)의 신뢰성 및 윤리성 연구
본 연구실은 최근 인공지능 분야에서 각광받고 있는 거대 언어 모델(LLM)의 신뢰성 및 윤리성 확보를 위한 다양한 연구를 진행하고 있습니다. LLM은 방대한 데이터를 기반으로 자연어를 이해하고 생성하는 능력을 갖추고 있으나, 환각(Hallucination) 현상이나 비윤리적 응답 생성 등 여러 한계점이 존재합니다. 이에 따라 연구실에서는 LLM이 생성하는 정보의 정확성과 일관성을 높이기 위한 환각 탐지 및 완화 기술, 그리고 응답의 윤리적 기준 준수를 위한 알고리즘 개발에 집중하고 있습니다.
특히, LLM의 환각 현상은 실제 존재하지 않는 정보를 사실처럼 생성하는 문제로, 신뢰성 있는 인공지능 서비스 구현에 큰 장애물이 됩니다. 이를 해결하기 위해 연구실에서는 다양한 데이터셋 구축, 지식 편집 기술, 그리고 모델의 의사결정 경향 분석을 통한 체계적인 접근을 시도하고 있습니다. 또한, LLM이 사회적·윤리적 기준에 부합하는 응답을 생성하도록 데이터 특성 분석과 윤리성 향상 기법을 개발하고 있습니다.
이러한 연구는 인공지능이 실제 사회에 안전하게 적용될 수 있도록 하는 데 필수적입니다. 연구실은 과학기술정보통신부 등 다양한 기관과 협력하여, 생성AI의 진실성과 일관성, 그리고 윤리성 확보를 위한 국가적 과제에도 적극 참여하고 있습니다. 앞으로도 LLM의 신뢰성과 윤리성 문제를 해결하기 위한 선도적 연구를 지속할 계획입니다.
한국어 자연어처리 핵심 기술: 형태소 분석, 개체명 인식, 구문 분석
본 연구실은 한국어 자연어처리의 핵심 기술 개발에 오랜 기간 집중해왔습니다. 형태소 분석, 개체명 인식, 구문 분석 등은 한국어의 복잡한 언어 구조를 이해하고 처리하는 데 필수적인 기술로, 다양한 인공지능 응용 서비스의 기반이 됩니다. 연구실에서는 curl 기반의 형태소 분석기, 개체명 인식기, 구문 분석기 등 실용적인 도구를 개발하여 실제 산업 및 학계에 제공하고 있습니다.
특히, 형태소 분석과 개체명 인식의 통합 모델, 중첩 개체명 인식, 품사 태깅, 의존 구문 분석 등 다양한 세부 기술을 심층 신경망, 레이블 주의 집중 네트워크 등 최신 딥러닝 기법과 결합하여 성능을 극대화하고 있습니다. 또한, 한국어의 특수성을 반영한 데이터셋 구축과 평가 방법론 개발에도 힘쓰고 있습니다. 이러한 연구 성과는 국내외 주요 학술대회 및 저널에 다수 발표되고 있으며, 관련 특허도 다수 보유하고 있습니다.
이와 같은 한국어 자연어처리 기술은 챗봇, 기계독해, 정보검색, 감성분석 등 다양한 응용 분야에 적용되고 있습니다. 연구실은 앞으로도 한국어뿐만 아니라 다국어 환경에서도 활용 가능한 범용 자연어처리 기술 개발을 목표로 연구를 지속할 예정입니다.
대화형 인공지능: 챗봇, 기계독해, 질의응답 시스템
연구실은 대화형 인공지능 시스템 개발에 있어 국내 최고 수준의 연구 역량을 보유하고 있습니다. 생성 기반 챗봇, 기계독해(MRC), 대화형 질의응답 시스템 등은 사용자의 자연어 입력을 이해하고, 맥락에 맞는 적절한 응답을 생성하는 기술로, 최근 인공지능 서비스의 핵심으로 자리잡고 있습니다. 연구실에서는 심층신경망 기반 챗봇, 문서 기반 질의응답, 문서 요약, 페르소나 챗봇 등 다양한 대화형 AI 모델을 개발하고 있습니다.
특히, KACTEIL-Book Reading Bot과 같은 독서봇, KACTEIL-MRC 기계독해 시스템 등은 실제 응용 가능한 수준의 성능을 보이며, 다양한 프로젝트와 특허를 통해 기술적 우수성을 입증하고 있습니다. 또한, 대화 데이터의 노이즈 제거, 멀티턴 대화, 감정 및 의도 인식 등 실제 서비스에서 요구되는 고도화된 기능 개발에도 힘쓰고 있습니다.
이러한 대화형 인공지능 연구는 교육, 헬스케어, 고객상담, 정보검색 등 다양한 산업 분야에 적용될 수 있으며, 연구실은 앞으로도 인간 중심의 지능형 대화 시스템 개발을 위해 지속적으로 연구를 확장해 나갈 계획입니다.
1
AESPA: Automated Essay Scoring Using Polished Argument Feature Weights
Junseo Jang*, Joosang Lee*, Yejin Lee, Seokwon Jeong, Harksoo Kim
Pattern Analysis and Applications (To be published), 1970
2
Does the Emotional Understanding of LVLMs Vary Under High-Stress Environments and Across Different Demographic Attributes?
Jaewook Lee*, Yeajin Jang*, Oh-Woog Kwon, Harksoo Kim
Proceedings of ACL 2025 (Main), 1970
3
Small Changes, Big Impact: How Manipulating a Few Neurons Can Drastically Alter LLM Aggression
Jaewook Lee*, Junseo Jang*, Oh-Woog Kwon, Harksoo Kim
Proceedings of ACL 2025 (Main), 1970
1
영역 적응형 자가학습 능력을 가진 기계 독해 시스템 개발
2
뉴럴-심볼릭 (neural-symbolic) 모델의 지식 학습 및 추론 기술 개발
3
(엑소브레인-2세부) WiseKB: 빅데이터 이해 기반 자가학습형 지식베이스 및 추론 기술 개발