프로젝트 소개
본 과제는 지도학습·비지도학습·준지도학습에서 categorical predictor variables를 제대로 쓰는 기법을 개발하여 예측의 정확성과 해석의 용이성을 높이는 연구임.
연구목표는 (1) 비지도학습 (2) 지도학습 (3) 준지도학습 (4) 고차원데용량데이터 통합에서 범주형 예측변수의 효율적 활용 방안 개발에 있음. 핵심내용은 군집분석의 거리 결합 시 likelihood 기반 결합, 의사결정나무에서 범주형 예측변수 처리로 분할 경우의 수 비용 절감, SVM·KNN에 범주형 예측변수 통합 및 차원 축소로 curse of dimensionality 완화, R패키지화 및 공개에 있음. 기대효과는 통계적 학습 성능 저하와 해석 제한을 줄이고 산업·학문 전반의 실사용 가치 증대에 있음.