신승준 연구실
데이터과학과 신승준
신승준 연구실은 고려대학교 통계학과를 기반으로 통계적 기계학습, 충분차원축소, 고차원 데이터 분석, 변수선택 및 정규화 기법 등 현대 통계학의 핵심 분야에서 국내외적으로 선도적인 연구를 수행하고 있습니다. 본 연구실은 이론적 연구와 실용적 응용을 균형 있게 추구하며, 다양한 실제 데이터 분석 경험을 바탕으로 학문적 성과와 사회적 파급효과를 동시에 창출하고 있습니다.
연구실의 주요 연구 분야 중 하나는 충분차원축소(SDR) 및 차원축소 기반의 기계학습 알고리즘 개발입니다. 선형 및 비선형 SDR, 커널 기반 SDR, 실시간 데이터 스트림 환경에서의 SDR 등 다양한 방법론을 제안하고 있으며, 지원 벡터 머신, 로지스틱 회귀, 분위수 회귀 등과 결합한 새로운 알고리즘을 통해 고차원 데이터의 해석력과 예측력을 높이고 있습니다. 이러한 연구는 실제 이항 분류, 다중 분류, 생존분석 등 다양한 문제에 적용되고 있습니다.
또한, 고차원 데이터 환경에서의 변수선택과 정규화 기법 연구도 활발히 이루어지고 있습니다. LASSO, SCAD, Adaptive LASSO, 그룹 LASSO 등 다양한 정규화 기반 변수선택 방법론을 개발하여, 유전체 데이터, 의료 데이터, 환경 데이터 등에서 유의미한 신호를 효과적으로 추출하고 있습니다. 변화점 탐지, 분위수 회귀, 생존분석 등 다양한 통계적 모형에 정규화 기법을 적용하여, 실제 문제 해결에 기여하고 있습니다.
신승준 연구실은 통계적 기계학습의 첨단 이론을 유전체, 의료, 환경, 경제, 마케팅 등 다양한 실제 데이터 분석에 적용하고 있습니다. 암 유전체의 이질성 분석, 환자 생존율 예측, 기온 변화 탐지, 실시간 소비 예측 등 사회적으로 중요한 이슈에 통계적 방법론을 적용하여 학문적 성과뿐만 아니라 사회적·산업적 가치를 창출하고 있습니다.
앞으로도 신승준 연구실은 통계적 기계학습, 충분차원축소, 고차원 데이터 분석 등 핵심 연구 분야에서 이론적 혁신과 실용적 응용을 동시에 추구하며, 데이터사이언스와 통계학의 미래를 선도하는 연구실로 자리매김할 것입니다.
Penalized Regression
Dimensionality Reduction
Quantile Regression
통계적 기계학습 및 충분차원축소(Sufficient Dimension Reduction)
신승준 연구실은 통계적 기계학습과 충분차원축소(SDR) 분야에서 국내외적으로 선도적인 연구를 수행하고 있습니다. 충분차원축소는 고차원 데이터에서 예측 변수의 차원을 효과적으로 줄이면서도 중요한 정보를 보존하는 방법론으로, 다양한 통계적 모형과 기계학습 알고리즘에 적용되고 있습니다. 본 연구실에서는 선형 및 비선형 SDR, 커널 기반 SDR, 그리고 실시간 데이터 스트림 환경에서의 SDR 등 다양한 이론적·실용적 방법론을 개발하고 있습니다.
특히, 지원 벡터 머신(SVM), 로지스틱 회귀, 분위수 회귀 등과 결합한 새로운 SDR 알고리즘을 제안하여, 이항 분류, 다중 분류, 생존분석 등 다양한 응용 문제에 적용하고 있습니다. 최근에는 딥러닝 기반의 SDR, 온라인 학습 환경에서의 차원축소, 그리고 초고차원 데이터에 적합한 변수선택 기법 등 첨단 연구를 활발히 진행 중입니다. 이러한 연구는 실제 데이터 분석에서의 해석력과 예측력을 동시에 높이는 데 큰 기여를 하고 있습니다.
연구실의 SDR 연구는 이론적 정당성, 계산 효율성, 실용적 적용성 모두를 중시하며, 다양한 시뮬레이션과 실제 데이터 분석을 통해 그 우수성을 입증하고 있습니다. 또한, 개발된 알고리즘은 오픈소스 패키지로 배포되어 학계와 산업계에서 널리 활용되고 있습니다. 앞으로도 신승준 연구실은 차세대 통계적 기계학습 및 차원축소 분야의 혁신을 선도할 계획입니다.
고차원 데이터 분석 및 변수선택, 정규화 기법 연구
고차원 데이터 분석은 현대 통계학과 데이터사이언스에서 가장 중요한 도전 과제 중 하나입니다. 신승준 연구실은 초고차원 데이터 환경에서의 변수선택, 정규화(regularization), 모델 해석력 향상에 중점을 두고 연구를 진행하고 있습니다. LASSO, SCAD, Adaptive LASSO, 그룹 LASSO 등 다양한 정규화 기법을 기반으로 한 변수선택 방법론을 개발하여, 예측 성능과 해석력을 동시에 높이고 있습니다.
특히, 변화점 탐지, 분위수 회귀, 생존분석 등 다양한 통계적 모형에서 정규화 기법을 적용하여, 실제 유전체 데이터, 의료 데이터, 환경 데이터 등에서 유의미한 신호를 효과적으로 추출하는 연구를 수행하고 있습니다. 또한, 유전학, 의학, 마케팅, 정치학 등 다양한 응용 분야에서 고차원 데이터 분석의 실질적 문제를 해결하기 위한 맞춤형 알고리즘 개발에도 힘쓰고 있습니다.
이와 더불어, 유전자 변이 분석, 암 위험 예측, 소비 동향 실시간 예측 등 실제 문제에 정규화 기반 변수선택 기법을 적용하여, 학문적 성과뿐만 아니라 사회적·산업적 파급효과도 창출하고 있습니다. 앞으로도 신승준 연구실은 고차원 데이터 분석의 이론적 발전과 실용적 응용을 동시에 추구할 예정입니다.
통계적 기계학습의 실용적 응용: 유전체, 의료, 환경, 경제 데이터 분석
신승준 연구실은 통계적 기계학습 및 데이터사이언스의 첨단 이론을 실제 사회적·과학적 문제에 적용하는 데에도 큰 역량을 보유하고 있습니다. 유전체 데이터 분석에서는 암 유전체의 이질성, 변이 탐지, 암 위험 예측 등 다양한 문제에 대해 베이지안 모형, 변화점 탐지, 정규화 회귀 등 최신 통계 기법을 적용하여 국제적으로 인정받는 연구 성과를 내고 있습니다.
의료 데이터 분석에서는 생존율 예측, 중도절단 데이터 분석, 개인 맞춤형 예후 예측 등 환자 맞춤형 의료에 기여하는 연구를 수행하고 있습니다. 예를 들어, 대장암 환자의 생존율 예측, Li-Fraumeni 증후군 환자의 다발성 암 위험 추정 등 실제 임상 데이터에 기반한 연구를 통해 의료 현장에 실질적인 도움을 주고 있습니다. 또한, 환경 데이터 분석에서는 기온 변화의 변화점 탐지, 대기오염과 건강지표의 연관성 분석 등 사회적으로 중요한 이슈에 통계적 방법론을 적용하고 있습니다.
경제 및 마케팅 분야에서는 빅데이터 기반 실시간 소비 예측, 변수선택을 통한 마케팅 전략 수립 등 데이터 기반 의사결정 지원 연구도 활발히 이루어지고 있습니다. 이처럼 신승준 연구실은 통계적 기계학습의 이론적 발전과 더불어, 다양한 실제 데이터에의 응용을 통해 학문적·사회적 가치를 창출하고 있습니다.
1
A least distance estimator for a multivariate regression model using deep neural networks
J Shin^, SJ Shin, S Bang
Journal of Statistical Computation and Simulation,
2
Personalized prediction of survival rate with combination of penalized Cox models in patients with colorectal cancer
SH Lee, JM Cha, SJ Shin
Medicine, 2024
3
Simultaneous estimation and variable selection for a non-crossing multiple quantile regression using deep neural networks
JM Shin^, SJ Shin, S Bang
Statistics and Computing, 2024
1
피셔일치성에 근거한 일반화 분류문제에 관한 연구