임희석 연구실
컴퓨터학과 임희석
임희석 연구실은 컴퓨터학과를 기반으로 자연어처리(NLP)와 인공지능(AI) 분야에서 국내외적으로 선도적인 연구를 수행하고 있습니다. 연구실은 특히 한국어의 언어적 특수성에 주목하여, 한국어에 최적화된 언어모델 개발, 형태소 분석, 분절 전략, 토큰화 기법 등 기초 기술부터 실제 응용 시스템까지 폭넓은 연구를 진행하고 있습니다. 이러한 연구는 한국어뿐만 아니라 다언어 환경에서의 자연어처리 기술 발전에도 크게 기여하고 있습니다.
연구실의 주요 연구 분야는 자연어처리 기반의 언어모델 개발, 기계번역 및 번역 품질 예측, 사후교정, 문법 오류 교정, 대화형 인공지능, 정보 추출, 문서 요약, 질의응답 시스템 등입니다. 최근에는 대규모 언어모델(LLM), 크로스-링구얼 포스트 트레이닝(XPT), 데이터 중심 AI, 제로샷 학습, 프롬프트 엔지니어링 등 최신 AI 기술을 적극적으로 도입하여, 저자원 언어 환경에서의 데이터 효율성과 성능을 극대화하는 혁신적인 방법론을 제시하고 있습니다.
임희석 연구실은 이론적 연구뿐만 아니라 실제 산업 및 사회 문제 해결에도 적극적으로 참여하고 있습니다. 예를 들어, 한국어 맞춤법 교정, 실시간 통번역, 음성인식 후처리, 챗봇, 가짜뉴스 탐지, 감성 분석, 추천 시스템 등 다양한 응용 시스템을 개발하고, 관련 특허를 다수 출원하였으며, 국가 연구과제와 산업체 협력 프로젝트도 활발히 수행하고 있습니다. 또한, 고품질 데이터셋 구축, 벤치마크 평가, 오픈소스 공개 등 학문적·사회적 파급력을 높이고 있습니다.
연구실은 국내외 주요 학술지 및 학회에서 활발히 논문을 발표하고 있으며, 다양한 국제 컨퍼런스에서 최신 연구 성과를 공유하고 있습니다. 또한, 교육 및 인재 양성에도 힘써, 차세대 자연어처리 및 인공지능 전문가를 배출하고 있습니다. 연구실의 구성원들은 다양한 배경을 바탕으로 창의적이고 도전적인 연구를 수행하며, 학문적 성장과 실질적 사회 기여를 동시에 추구하고 있습니다.
임희석 연구실은 앞으로도 자연어처리와 인공지능 분야에서 혁신적인 연구를 지속하며, 한국어 및 다언어 환경에서의 언어지능 기술 발전을 선도할 것입니다. 연구실은 학문적 깊이와 실용적 가치를 동시에 추구하며, 인공지능 기반의 미래 사회 구현에 핵심적인 역할을 할 것을 목표로 하고 있습니다.
Information Extraction
Dialogue System
Question-Answering
자연어처리와 한국어 특화 언어모델 연구
임희석 연구실은 자연어처리(NLP) 분야에서 오랜 기간 동안 선도적인 연구를 수행해왔으며, 특히 한국어의 언어적 특성과 한계에 주목하여 다양한 언어모델 개발에 집중하고 있습니다. 연구실은 한국어의 교착어적 특성, 복잡한 형태소 구조, 어순의 유연성 등 언어적 특수성을 반영한 토큰화 전략, 형태소 분석, 분절 전략 등을 심도 있게 연구합니다. 이를 통해 한국어에 최적화된 사전학습 언어모델(PLM), 관계 추출, 개체명 인식, 품질 예측 등 다양한 하위 태스크에서 세계적 수준의 성과를 내고 있습니다.
최근에는 대규모 언어모델(LLM)과 크로스-링구얼 포스트 트레이닝(XPT) 등 첨단 기술을 활용하여 저자원 언어인 한국어의 데이터 효율성과 성능을 극대화하는 방법론을 제시하고 있습니다. 또한, 한국어 맞춤법 교정, 문법 오류 수정, 대화형 챗봇, 문서 요약, 질의응답 등 실제 산업 및 교육 현장에서 활용 가능한 응용 시스템 개발에도 적극적으로 참여하고 있습니다. 연구실은 다양한 공개 데이터셋 구축, 벤치마크 평가, 실험적 분석을 통해 한국어 자연어처리의 한계를 극복하고, 글로벌 수준의 언어모델 연구를 선도하고 있습니다.
이러한 연구는 한국어뿐만 아니라 다언어 환경에서의 언어모델 전이학습, 데이터 증강, 품질 평가 등 다양한 응용 분야로 확장되고 있습니다. 임희석 연구실의 연구 성과는 국내외 주요 학술지 및 학회에서 활발히 발표되고 있으며, 산업체와의 협력, 특허 출원, 국가 연구과제 수행 등 실질적 사회적 기여로 이어지고 있습니다.
기계번역, 품질 예측 및 사후교정 기술
임희석 연구실은 기계번역(Machine Translation, MT) 분야에서 데이터 구축, 번역 품질 예측(QE), 사후교정(APE) 등 전 주기에 걸친 연구를 수행하고 있습니다. 연구실은 고품질 병렬 말뭉치 구축, 데이터 필터링, 토큰화 및 분절 전략, 도메인 특화 번역 등 다양한 방법론을 통해 번역 성능을 극대화하고 있습니다. 특히, 저자원 언어 환경에서의 번역 품질 향상, 데이터 중심 접근법, 디코딩 전략, 오류 유형 분석 등 실질적 문제 해결에 초점을 맞추고 있습니다.
기계번역 품질 예측(QE) 분야에서는 레퍼런스 없이 번역 결과의 품질을 자동으로 평가하는 기술을 개발하고, 다양한 언어쌍 및 도메인에서의 제로샷 학습, 다언어 사전학습 모델의 성능 비교, 데이터 증강 및 필터링 기법을 연구합니다. 또한, 사후교정(APE) 연구를 통해 번역 시스템의 결과물을 자동으로 교정하는 모델을 개발하고, 노이즈 생성, 전이학습, 외부 지식 활용 등 혁신적인 방법론을 제시하고 있습니다.
이러한 연구는 실제 산업 현장에서의 실시간 번역, 자막 생성, 음성인식 후처리, 치명적 오류 탐지 등 다양한 응용 분야로 확장되고 있습니다. 연구실은 기계번역의 신뢰성, 효율성, 실용성을 높이기 위한 데이터셋 구축, 벤치마크 평가, 특허 출원 등 다각도의 노력을 기울이고 있으며, 국내외 학술대회 및 저널을 통해 활발히 연구 성과를 발표하고 있습니다.
1
An analysis on language transfer of pre-trained language model with cross-lingual post-training
임희석
EXPERT SYSTEMS WITH APPLICATIONS, 202504
2
A large-scale dataset for korean document-level relation extraction from encyclopedia texts
임희석
APPLIED INTELLIGENCE, 202409
3
Automated Compliance Checking System for Structural Design Codes in a BIM Environment
임희석
KSCE JOURNAL OF CIVIL ENGINEERING, 202408
1
2024년 대학기술경영촉진사업(TLO혁신형)_고려대학교
2
생성AI가 생성한 결과물의 진실성과 일관성 확보를 위한 기술 연구