프로젝트 소개
본 과제는 데이터 분석에서 범주형 예측변수(categorical predictor variables)를 지도학습·비지도학습·준지도학습에 효율적으로 넣어 예측 정확도와 해석 용이성을 높이는 기법 개발임.
연구 목표는 (1) 비지도학습, (2) 지도학습, (3) 준지도학습, (4) 고차원데용량데이터에서 범주형 예측변수를 통합하는 합리적 방안 확립에 있음. 핵심 연구 내용은 군집분석을 위한 거리결합, 의사결정나무에서 범주형 예측변수 분할 효율화, SVM에 범주형 예측변수 통합, KNN에서 가변수 변환으로 인한 curse of dimensionality 완화 및 차원 축소 전략 개발임. 기대 효과는 변수 역할에 따른 정교한 처리로 예측 성능과 해석 범위가 향상되며, R패키지를 개발해 공개로 실제 산업 활용과 학문 발전 기여가 기대됨.