연구실에서 최근에 진행되고 있는 관심 연구 분야
1
머신 망각학습(Machine Unlearning) 및 지식 망각학습(Knowledge Unlearning)
머신 망각학습과 지식 망각학습은 인공지능 모델이 특정 데이터나 지식을 선택적으로 잊도록 만드는 첨단 연구 분야입니다. 기존의 기계학습 모델은 한 번 학습한 데이터를 완전히 제거하는 것이 어렵지만, 개인정보 보호 및 데이터 삭제 요청이 증가함에 따라 이러한 기술의 필요성이 대두되고 있습니다. 머신 망각학습은 모델이 특정 데이터의 영향을 효과적으로 제거하여, 해당 데이터가 학습에 사용되지 않은 것과 유사한 상태로 만드는 것을 목표로 합니다. 지식 망각학습은 더 나아가, 모델이 이미 내재화한 특정 지식이나 사실을 선택적으로 잊도록 설계하는 방법론을 포함합니다. 이는 대규모 언어 모델이나 지식 그래프 기반 모델에서 잘못된 정보, 편향된 지식, 혹은 삭제가 요구되는 정보를 효과적으로 제거하는 데 활용됩니다. 본 연구실에서는 이러한 망각학습 기법의 이론적 기반을 다지고, 실제 자연어처리 및 정보검색 시스템에 적용하는 다양한 실험을 수행하고 있습니다. 이러한 연구는 개인정보 보호법 준수, 모델의 신뢰성 향상, 그리고 동적 데이터 환경에서의 유연한 모델 운용을 가능하게 합니다. 앞으로 망각학습 기술은 인공지능의 윤리적 활용과 실시간 데이터 관리에 필수적인 요소로 자리잡을 것으로 기대됩니다.
2
거대 언어 모델 기반 긴 문서 요약 및 사실성 교정
최근 자연어처리 분야에서는 거대 언어 모델(Large Language Model, LLM)을 활용한 긴 문서 요약 및 요약문의 사실성 검증이 중요한 연구 주제로 부상하고 있습니다. 본 연구실은 지식 그래프와 LLM을 결합하여, 방대한 양의 정보를 효과적으로 요약하고, 요약문 내의 사실 불일치 문제를 해결하는 기술을 개발하고 있습니다. 특히, LLM의 Hallucination 현상(사실과 다른 정보를 생성하는 문제)을 완화하고, 요약문의 신뢰도를 높이기 위한 다양한 알고리즘을 연구합니다. 이 과정에서 지식 그래프를 활용하여 문서 내의 핵심 개체와 관계를 구조적으로 파악하고, 이를 바탕으로 요약문이 원문과 논리적으로 일치하는지 자동으로 판단 및 교정하는 방법론을 제시합니다. 또한, 토큰 단위의 사실성 교정, 요약문 내 개체명 검증, 다중 문서 요약 등 다양한 응용 분야에 기술을 확장하고 있습니다. 이러한 연구는 정보의 신뢰성과 투명성을 높이는 데 큰 기여를 하고 있습니다. 향후에는 더욱 복잡한 문서 구조와 다양한 도메인에 적용 가능한 요약 및 사실성 검증 기술을 개발할 계획입니다. 이를 통해 인공지능 기반 정보 요약 시스템의 실용성과 신뢰성을 한층 강화할 수 있을 것으로 기대됩니다.
3
딥러닝 기반 정보 검색 및 질의 변환
딥러닝 기술의 발전과 함께 정보 검색 분야에서도 혁신적인 변화가 일어나고 있습니다. 본 연구실은 딥러닝 기반의 정보 검색 시스템, 질의 변환, 문서 확장 등 다양한 주제를 심도 있게 연구하고 있습니다. 특히, 사용자의 질의를 더 효과적으로 해석하고, 관련성 높은 문서를 신속하게 찾아주는 기술 개발에 집중하고 있습니다. 질의 변환 기술은 사용자의 자연어 질의를 시스템이 이해하기 쉬운 형태로 변환하여, 정보 검색의 정확도와 효율성을 높이는 데 중요한 역할을 합니다. 또한, 문서 확장 기법을 통해 기존 문서의 정보를 보강하거나, 다양한 관점에서 재구성함으로써 검색 결과의 품질을 향상시키고 있습니다. 이러한 연구는 대규모 데이터 환경에서의 실시간 검색, 다중 문서 질의 응답, 맞춤형 정보 제공 등 다양한 응용 분야에 활용되고 있습니다. 앞으로도 본 연구실은 최신 딥러닝 모델과 자연어처리 기술을 접목하여, 더욱 지능적이고 사용자 친화적인 정보 검색 시스템을 개발할 계획입니다. 이를 통해 정보의 접근성과 활용도를 극대화하는 데 기여하고자 합니다.