본 과제의 목표는 소량의 데이터를 활용한 효율적인 학습만으로도 대규모 훈련 데이터를 사용해 학습한 모델의 뛰어난 일반화 성능을 효과적으로 근사하는 데이터 효율적 기계학습 기술을 개발하는 것이다. 이를 위해 우선 대규모 데이터셋을 활용한 신경망 학습 경로를 효율적으로 근사할 수 있는 소량의 응축 데이터 합성 및 가치 데이터 선별 기술을 개발할 것이다. 데이터...
데이터 효율적 학습
약한 지도를 통한 강한 일반화
신경망 규모 법칙
약한 지도 신호
지식 증류
2
2024년 7월-2027년 4월
|375,000,000원
신뢰 가능한 파운데이션 모델을 위한 이론적 프레임워크 및 확장 가능한 개인화 솔루션 개발
본 기초연구실의 최종 목표는 신뢰 가능한 파운데이션 모델을 위한 이론적 프레임워크 개발 및 확장 가능한 개인화 솔루션 제안이다. 우선 파운데이션 모델의 신뢰성 및 안정성 측면에서의 취약점을 보완하고 효과적 개인화 솔루션을 제시하고자 그 동작원리를 이론적으로 분석한다. 수학적으로 정립된 이론적 프레임워크는 파운데이션 모델의 실질적인 취약점 개선에 활용한다. ...
파운데이션 모델
거대언어모델
신뢰성
개인화
확장성
3
2024년 6월-2026년 12월
|1,683,334,000원
뇌질환 진단 및 치료용 비침습 근적외선 기반 AI 기술
- 본 과제의 목표는 기능적 근적외선 분광법(fNIRS) 데이터 기반의 인공지능 모델을 통해 환자의 뇌질환·뇌상태를 효과적으로 진단하는 의료 통합 프레임워크 개발임? 상기 목표 달성을 위해 인공지능 기반의 fNIRS 데이터의 가공 및 라벨링, 데이터 증강, 모델 특성화 및 경량화를 통한 하나의 추론 모델을 제공하는 것을 목표로 함? 통합된 프레임워크 내 기...
비침습 근적외선 분광법
AI 기반 뇌질환 진단
다채널 데이터 가공
fNIRS 특화 학습
효율적 학습 및 추론
4
2021년 2월-2025년 2월
|128,555,000원
불완전한 데이터를 활용하는 기계학습 기술 개발
본 연구의 궁극적 목표는 데이터의 한계를 뛰어넘는 기계학습 기술 개발이다. 본 연구는 고품질 데이터를 확보하지 못한 상황에서도 자동화 된 데이터 선별 및 강조 기술, 데이터 가치에 기반을 둔 기계학습 알고리즘 개발을 통해 기계학습 분야의 데이터 장벽을 없애고, 보다 경제적이고 효율적인 기계학습 분야 발전을 이끄는 것을 목표로 한다. 이 목표를 위해 가공되지...
미가공 미분류 데이터
자동화 된 데이터 가치 평가 기술
데이터 가치 강조 학습
뉴럴넷 학습 다이나믹
도메인
5
주관|
2021년 2월-2025년 2월
|142,838,000원
불완전한 데이터를 활용하는 기계학습 기술 개발
자동화 된 데이터 가치 평가 기법 개발: 기존에 사람의 판단에 의존했던 데이터 가치 평가의 완벽한 자동화를 이루기 위해 수학적으로 잘 정의 된 데이터 가치 평가 기준을 도입하고, 각각의 데이터 포인트 가치를 효율적으로 계산하기 위한 데이터 가치 정량화 알고리즘을 제시한다.
뉴럴넷 학습 다이나믹을 활용한 데이터 분류 체계 개발: 데이터 가치평가를 위한 계산량을 획기적으로 감소시키기 위해 가치 계산과 학습을 동시에 수행 할 수 있는 알고리즘을 개발한다. 각 데이터 샘플이 가진 고유의 특성(대표성, 예외성, 모호성, 에러 등)에 따라 뉴럴넷이 각 데이터를 기억하고 일반화 하는 속도가 다름을 활용한 데이터 분류 체계를 확립한다.
데이터 강조 기술을 통한 기계학습 성능 향상: 데이터 가치 평가를 통해 특정 질적 기준을 만족하지 않는 데이터를 자동으로 제거하고 나머지 데이터에 대한 가치 값을 학습 가중치로 활용하는 데이터 가치 강조 기계학습 알고리즘을 제안한다.
기존 보유 데이터 중 학습에 도움이 되는 데이터를 선별하는 학습 도메인 적응 기술: 기존 보유 데이터 중 새 어플리케이션에 활용 가능한 부분적 데이터셋을 자동으로 선별하기 위한 도메인 적응 데이터 평가 기준을 제시한다. 도메인에 따라 변화하는 각 데이터 샘플의 가치 값을 활용한 기계학습 알고리즘을 구현한다.
효율적 가상 데이터셋 생성 방안 및 이를 통한 학습 성능 개선: 가상 데이터셋을 활용한 학습 기법을 개발한다. 실제 데이터셋을 활용한 학습에 비해 성능이 저하되는 단점을 해결하기 위해 가치 높은 가상 데이터셋을 생성할 수 있는 방안을 제안한다.