연구 영역

대표 연구 분야

연구실에서 최근에 진행되고 있는 관심 연구 분야

1

신뢰할 수 있는 대형 언어 모델(LLM) 및 코드 생성

최근 인공지능 분야에서 대형 언어 모델(LLM)의 활용이 급격히 증가함에 따라, 신뢰성과 안전성에 대한 요구가 높아지고 있습니다. 본 연구실은 신뢰할 수 있는 LLM 개발과 코드 생성의 신뢰성 확보를 핵심 연구 주제로 삼고 있습니다. 특히, LLM이 생성하는 코드의 정확성, 보안성, 그리고 예측 결과의 신뢰도를 체계적으로 평가하고 개선하는 방법론을 개발하고 있습니다. 이러한 연구를 위해 본 연구실은 선택적 코드 생성(Selective Code Generation), 신뢰 기반 검색 증강 질의응답(Trustworthy Retrieval Augmented Question Answering), 그리고 적합성 보장(Functional Guarantees) 등 다양한 접근법을 시도하고 있습니다. 예를 들어, 코드 생성 과정에서 발생할 수 있는 오류나 취약점을 사전에 탐지하고, 안전한 코드만을 선택적으로 제공하는 시스템을 구축하고 있습니다. 또한, LLM의 예측 결과에 대한 불확실성을 정량적으로 평가하여, 사용자가 신뢰할 수 있는 정보를 제공받을 수 있도록 하는 기술을 연구합니다. 이러한 연구는 실제 소프트웨어 개발 현장에서의 자동화, 보안 강화, 그리고 인공지능 시스템의 신뢰성 제고에 큰 기여를 할 것으로 기대됩니다. 앞으로도 본 연구실은 LLM의 신뢰성, 안전성, 그리고 실용성 향상을 위한 혁신적인 연구를 지속적으로 추진할 계획입니다.

2

기계학습의 신뢰성, 불확실성 정량화 및 머신 언러닝

기계학습 시스템이 실제 환경에서 널리 사용됨에 따라, 모델의 신뢰성 확보와 불확실성 정량화가 매우 중요한 연구 주제로 부상하고 있습니다. 본 연구실은 불확실성 정량화(Uncertainty Quantification), PAC 예측 집합(PAC Prediction Sets), 그리고 머신 언러닝(Machine Unlearning) 등 신뢰성 있는 기계학습을 위한 다양한 이론적·실용적 방법론을 연구하고 있습니다. 불확실성 정량화는 모델이 내리는 예측의 신뢰도를 수치적으로 표현하여, 사용자가 결과를 해석하고 의사결정을 내릴 때 도움을 주는 기술입니다. 본 연구실은 딥러닝 모델의 예측 신뢰도 평가, 라벨 시프트(Label Shift) 및 공변량 시프트(Covariate Shift) 상황에서의 적응적 예측, 그리고 메타러닝 환경에서의 신뢰성 있는 예측 집합 생성 등 다양한 주제를 다루고 있습니다. 또한, 머신 언러닝 분야에서는 이미 학습된 모델에서 특정 데이터의 영향을 효과적으로 제거하는 방법을 개발하여, 개인정보 보호와 규제 준수에 기여하고 있습니다. 이러한 연구는 의료, 금융, 자율주행 등 신뢰성과 안전성이 중요한 응용 분야에서 기계학습 모델의 실질적 활용도를 높이는 데 중요한 역할을 합니다. 앞으로도 본 연구실은 신뢰성 있는 인공지능 시스템 구축을 위한 이론적 기반과 실용적 솔루션 개발에 앞장설 것입니다.

3

AI 레드팀 및 공격 탐지, 강건한 인공지능

인공지능 시스템이 점점 더 복잡해지고 다양한 환경에서 활용됨에 따라, 보안 위협과 공격에 대한 대응이 필수적입니다. 본 연구실은 AI 레드팀(Red Teaming) 기법을 활용하여 인공지능 모델의 취약점을 사전에 탐지하고, 강건한 인공지능 시스템을 설계하는 연구를 수행하고 있습니다. 레드팀은 실제 공격 시나리오를 모사하여 모델의 약점을 분석하고, 이를 바탕으로 방어 전략을 개발하는 역할을 합니다. 특히, UAV(무인항공기)와 같은 사이버-물리 시스템에서의 공격 탐지, 음향 사이드 채널을 이용한 공격 분석, 그리고 악의적 테스트 샘플에 대한 강건한 적응 기법 등 다양한 응용 분야에서 연구를 진행하고 있습니다. 예를 들어, SOUNDBOOST와 같은 프로젝트를 통해 UAV의 음향 신호를 분석하여 공격을 조기에 탐지하고, 시스템의 안전성을 높이는 기술을 개발하였습니다. 또한, 적대적 공격(Adversarial Attack)에 강인한 분류기 설계, 학습 데이터에 대한 공격 대응 등도 주요 연구 주제입니다. 이러한 연구는 인공지능 시스템의 실질적 보안성 강화와 신뢰성 확보에 크게 기여하며, 미래의 다양한 AI 응용 분야에서 안전하고 신뢰할 수 있는 시스템 구축에 중요한 밑거름이 될 것입니다.