프로젝트 소개
본 과제는 데이터 분석에서 자주 등장하는 범주형 예측변수(categorical predictor variables)를 지도학습·비지도학습·준지도학습에 효율적으로 적용해 예측 정확도와 해석 쉬움을 높이는 기법 개발임.
연구 목표는 (1) 비지도학습, (2) 지도학습, (3) 준지도학습, (4) 고차원·대용량데이터에서 범주형 예측변수를 통합하는 합리적 방안 개발임. 핵심 연구 내용은 군집분석에서 우도(likelihood) 기반 결합, 의사결정나무에서 범주형 예측변수의 효율적 분할, SVM의 통합, KNN의 차원 축소 전략, R패키지 구현 및 공공사이트 공개임. 기대효과는 예측 성능 저하와 해석 제한을 줄이고 전 세계 분석가의 활용을 통한 산업 가치 창출임.