RnDCircle Logo
자연어 처리 연구실
임희석 교수
한국어 초거대 언어 모델 (KULLM / Korea University Large Language Model)
Retrieval‑Augmented Generation (RAG)
임베딩 기반 검색 (Dense & Term‑based Retrieval / KURE)
기본 정보
연구 분야
프로젝트
논문
구성원

자연어 처리 연구실

임희석 교수

고려대학교 컴퓨터공학과 NLP & AI 연구실은 한국어 자연어처리(Korean NLP) 및 거대언어모델(LLM)을 중심으로 데이터 중심 언어 모델링, 한국어 상식 추론, 텍스트 품질 필터링, OCR 텍스트 보정, Hallucination 정량 평가, 문장 임베딩 및 언어 전이 최적화 등 다양한 최신 분야의 연구를 수행하고 있습니다. 최근 ACL, NAACL, EMNLP, ICLR, COLING 등 국제 최상위 학회에 다수의 논문을 게재하며, KoCommonGEN v2, K-HALU, Dataverse, Open Ko-LLM Leaderboard, REVISE, MIRAGE 등 연구성과를 통해 자연어처리 분야에서 우수논문상을 포함한 다수의 학술적 성과를 거두었습니다. 임희석 교수는 고려대학교 컴퓨터공학과 소속으로, AI 및 NLP 분야에서 뛰어난 학문적 업적과 리더십을 인정받고 있으며, 연구실은 신경망 기반 언어 모델과 평가 데이터셋 구축, Retrieval-Augmented Generation, 오류 검출 및 편향 평가, 토큰화 전략 연구 등 한국어 특화 연구를 중심으로 활발히 활동 중입니다. 연구실은 체계적인 멘토링과 국제 학회 경험 제공을 통해 NLP 분야의 실질적 전문 인재 양성에 기여하고 있습니다.

한국어 초거대 언어 모델 (KULLM / Korea University Large Language Model)Retrieval‑Augmented Generation (RAG)임베딩 기반 검색 (Dense & Term‑based Retrieval / KURE)머신 번역 (Neural Machine Translation, NMT)자연어 생성 (Natural Language Generation)
대표 연구 분야
연구 영역 전체보기
사용자 참여 및 소셜 그래프 기반 한국어 가짜뉴스 탐지 연구 thumbnail
사용자 참여 및 소셜 그래프 기반 한국어 가짜뉴스 탐지 연구
Korean Fake News Detection with User Engagement and Social Graphs
연구 분야 상세보기
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

132총합

5개년 연도별 피인용 수

1,152총합
주요 논문
3
논문 전체보기
1
article
|
·
인용수 0
·
2024
An analysis on language transfer of pre-trained language model with cross-lingual post-training
Suhyune Son, Chanjun Park, Jungseob Lee, Midan Shim, Chanhee Lee, Yoonna Jang, Jaehyung Seo, Jungwoo Lim, Heuiseok Lim
IF 7.5 (2024)
Expert Systems with Applications
https://doi.org/10.1016/j.eswa.2024.125841
Computer science
Natural language processing
Artificial intelligence
Transfer (computing)
Training (meteorology)
Transfer of learning
First language
Linguistics
2
article
|
인용수 2
·
2023
Adaptive Multi-Domain Dialogue State Tracking on Spoken Conversations
Jungwoo Lim, Taesun Whang, Dongyub Lee, Heuiseok Lim
IF 4.1 (2023)
IEEE/ACM Transactions on Audio Speech and Language Processing
과업 지향 대화 시스템의 주된 목표는 인간 대화의 의도와 요구를 파악하는 것이다. 기존의 많은 연구는 서면 대화(written dialogue) 설정에서 수행되지만, 실제 환경의 음성 대화(spoken dialogues)를 처리하는 데에는 항상 어려움이 존재한다. 이를 위해 DSTC10 챌린지 주최 측은 음성 대화에 기반한 견고한 대화 상태 추적(dialgue state tracking, DST) 모델을 구축하는 과제를 제안한다. 본 논문은 강력한 기존 DST 모델(즉, MinTL)을 바탕으로 대화 상태 추적기를 구축하기 위한 핵심 구성 요소를 제시한다. 1) 데이터 증강은 평가 데이터셋에 존재하는 개체를 포착하는 모델의 능력을 효과적으로 향상시킨다. 2) 레벤슈타인 후처리(Levenshtein post-processing)는 자동 음성 인식 오류로 인해 발생하는 모델 예측의 왜곡을 방지하는 것을 목표로 한다. 본 방법의 효과를 검증하기 위해 DSTC10 데이터셋에서 모델을 평가하고, 모델의 각 구성 요소를 제거(ablating)하여 질적 분석을 수행한다. 실험 결과, 본 모델은 모든 평가 지표에서 기준선(baseline) 대비 유의하게 더 높은 성능을 보였으며, 챌린지에서 3위를 차지했다.
http://dx.doi.org/10.1109/taslp.2023.3302232
Levenshtein distance
Computer science
Task (project management)
Artificial intelligence
Natural language processing
Spoken language
Component (thermodynamics)
Domain (mathematical analysis)
Speech recognition
Machine learning
3
article
|
·
인용수 0
·
2023
Doubts on the reliability of parallel corpus filtering
Hyeonseok Moon, Chanjun Park, Seonmin Koo, Jungseob Lee, Seungjun Lee, Jaehyung Seo, Sugyeong Eo, Yoonna Jang, Hyunjoong Kim, Hyoung-gyu Lee, Heuiseok Lim
IF 7.5 (2023)
Expert Systems with Applications
https://doi.org/10.1016/j.eswa.2023.120962
Interpretability
Computer science
Artificial intelligence
Reliability (semiconductor)
Deep learning
Quality (philosophy)
Adaptability
Filter (signal processing)
Sentence
Natural language processing
최신 정부 과제
50
과제 전체보기
1
2024년 6월-2026년 12월
|650,000,000
2024년 대학기술경영촉진사업(TLO혁신형)_고려대학교
본 사업을 통해 KU의 우수 연구성과를 발굴하여 기술사업화 전주기 지원을 강화하고, 기술사업화 협력 프로젝트 성공을 통해 KU 기술사업화 조직의 혁신모델 수립 및 확산하고자 함
기술사업화
2
2024년 3월-2026년 12월
|1,393,000,000
생성AI가 생성한 결과물의 진실성과 일관성 확보를 위한 기술 연구
본 연구개발과제에서는 신뢰할 수 있는 생성 AI 기술의 확보를 위해 결과물에 대한 사실적 일관성과 진실성을 검증할 수 있는 탐지하는 기술을 개발하고, 일관된 논지로 진실한 정보만을 처리할 수 있도록 환각 현상을 완화하는 기술을 개발하며, 이를 정량적으로 평가할 수 있는 벤치마크 구축을 목표로 함
환각
사실적 일관성
진실성
탐지
완화
3
주관|
2023년 9월-2024년 8월
|75,000,000
리터러시 역량 향상을 위한 AI 기반 생각구조화 학습튜터링 기술 개발
본 과제는 리터러시 역량 향상을 위해 초중고 학생의 사고구조를 생각구조화 프로그램으로 학습 튜터링하는 AI 기반 교수학습 솔루션을 개발하는 연구임. 연구목표는 공부력·문해력·사고력·표현력·자기주도학습능력·문제해결능력 향상을 위한 인공지능 자연어처리(NLP) 튜터링 상용화를 추진하는 데 있음. 핵심연구내용은 LLM 기반 키워드 빈칸 생성 엔진, 범주화 추천, phrase 임베딩-유사도 기반 답안생성 모듈, 교육 도메인 특화 딥러닝 언어모델, MLM 확률 기반 합성 정보 선택과 가변 길이 요약문 생성 AI 튜터링 시스템 구축임. 기대효과는 문해력 향상과 온라인 에듀테크 글로벌 경쟁력 확보 및 온라인 콘텐츠·모바일 앱·교육 플랫폼(AWS 연동) 사업화로 사교육 지출 완화와 매출·일자리 창출 가능성 증대임.
인공지능
문해력
자연어처리
스마트 러닝
온라인 교육
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
공개2024대화 상황에서의 페르소나 과사용 탐지 장치 및 방법1020240125712-
공개2024유형 다양성을 고려한 질의응답쌍 생성 장치 및 방법1020240009742
공개2023노년기 마음돌봄 서비스 제공 장치 및 방법1020230197150
전체 특허

대화 상황에서의 페르소나 과사용 탐지 장치 및 방법

상태
공개
출원연도
2024
출원번호
1020240125712

유형 다양성을 고려한 질의응답쌍 생성 장치 및 방법

상태
공개
출원연도
2024
출원번호
1020240009742

노년기 마음돌봄 서비스 제공 장치 및 방법

상태
공개
출원연도
2023
출원번호
1020230197150
연구실 하이라이트
연구실의 정보를 AI가 요약해서 키워드 중심으로 정리해두었어요
독보적기술
한국어 초거대 언어 모델(LLM) 기술 선도
AI 요약 확인하기
학술성과
세계 최고 수준의 학술적 성과 및 리더십
AI 요약 확인하기
기술파급력
LLM의 신뢰성 문제 해결: 환각(Hallucination) 정량 평가 및 완화
AI 요약 확인하기
산업생태계
한국어 NLP 산업 생태계 구축 및 기여
AI 요약 확인하기
연구자역량
최고 수준의 AI 인재 배출 및 양성
AI 요약 확인하기
연구인프라
대규모 모델 학습을 위한 압도적인 연구 인프라
AI 요약 확인하기
맞춤형 인사이트 리포트
연구실의 전체 데이터를 활용한 맞춤형 인사이트 리포트
연구 트렌드부터 공동 연구 방향성 기획까지
연구실과 같이 할 수 있는게 무엇인지,
지금 바로 확인해보세요
무료 리포트 확인하기

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.