본 연구의 최종목표는 CLIP(Contrastive Language-Image Pre-training)을 비롯하여 SigLIP2와 같은 최신 비전-언어 모델(Vision-Language Model, VLM)에서 특정 개념의 표현을 효과적으로 제거하는 범용적이고 강건한 개념 제거 기법을 개발하는 것이다. 텍스트와 이미지 간 의미적 연관성을 학습하는 이러한 모...
개념 제거
멀티모달 생성 모델
표현 공간 조작
우회 공격 방어
생성형 AI의 안전성과 윤리성
2
2025년 8월-2027년 8월
|25,000,000원
신뢰가능한 인공지능을 위한 연속 학습 환경 내 선형성 기반 데이터 의존도 완화형 지식 소거
1) 학업 목표 및 계획- 최종적으로는 인공지능 모델의 심층적인 작동 원리에 대해 이해한 내용을 토대로 신뢰성 있는 인공지능 기술을 개발하는 데에 이바지하고자 함.- “연속 학습 환경에서 작업 단위의 선택적 지식 소거” 연구는 신뢰할 수 있는 인공지능 기술을 향한 첫 발걸음으로, 최근 사회에 대두되는 인공지능 안전성 문제를 완화하는 명시적인 방법임. 컴퓨터...
딥러닝
신뢰 가능한 인공지능
지식 소거
연속 학습
대형 언어 모델
3
2025년 8월-2026년 8월
|6,000,000원
전역적 제어가 가능한 음성 생성 프레임워크 연구
본 연구에서는 배경음과 원하는 위치의 foreground 음성부터 상황에 알맞은(깔끔한 소리가 아닌 실제 해당 상황 내에서 말하는 것 같은) 말소리까지, 음성 요소를 전역으로 제어하여 음성을 생성하는 통합적 음성 생성 프레임워크를 제안한다. 이를 통해 실제 세상과 아주 밀접한 소리를 사람이 원하는 대로 만들 수 있다. 해당 프레임워크는 배경음 생성 모델과 ...
음성 생성
프레임워크
전역적 제어
음성
환경 적응
4
2025년 8월-2026년 8월
|6,000,000원
경계 인식 정보 기반 3차원 가우시안 최적화를 통한 객체 분할 정확도와 장면 복원 품질 동시 향상
다중 뷰 이미지 데이터를 이용해 3차원 장면을 다양한 크기와 색을 가진 수십만개의 3차원 Gaussian 분포로 표현하는 3D Gaussian Splatting(3DGS) 모델을 기반으로 한 3D 객체 분할(segmentation) 연구를 진행한다. 현재 해당 연구의 경향은 2D 비전 모델의 고차원 특징을 3D Gaussian에 전이하는 방법론인 Featu...
3차원 가우시안 스플래팅
3차원 객체 분할 방법 연구
"경계 인식 정보" 개념 제안
인간의 인식 과정을 모방한 통합 학습 모델
3D 장면 복원률과 객체 분할 정확도 동시 향상
5
2025년 8월-2026년 8월
|6,000,000원
모달리티 특화 융합 기반 카메라-레이더 3D 객체 탐지
본 연구에서는 3D 환경에서의 객체 탐지를 위한 센서 퓨전에 대한 연구를 진행한다. 특히, 다중 시점 카메라와 레이더 데이터의 역할을 이해하여 객체 탐지의 성능 및 효율성을 향상시키는 데 초점을 맞춘다. 3D 객체 탐지는 자율주행 차량이 주변의 차량, 보행자, 자전거 등을 입체적으로 인식하고 경로를 예측하는 데 핵심적인 기술이다. 실시간으로 주변 상황에 대...