기본 정보
연구 분야
프로젝트
발행물
구성원
연구 영역
대표 연구 분야
연구실이 가장 잘하는 대표 연구 분야
1

의사결정나무 기반 데이터마이닝 방법론

조형준 연구실의 핵심 연구 주제 가운데 하나는 의사결정나무를 중심으로 한 데이터마이닝 방법론의 개발과 고도화이다. 연구실의 대표 키워드로 제시된 Decision Tree와 관련 저서인 「데이터마이닝」, 그리고 다수의 학술대회 발표 이력은 이 연구실이 분류와 예측을 위한 트리 기반 통계학습에 지속적으로 집중해 왔음을 보여준다. 특히 복잡한 데이터 구조에서도 해석 가능성과 예측 성능을 함께 확보할 수 있는 모델을 설계하는 데 강점을 가진다. 이 연구실은 단순한 정적 분류 문제를 넘어 종단자료, 반복측정자료, 생존자료, 구간중도절단자료 등 현실 데이터에서 자주 등장하는 복합 구조를 트리 모델에 반영하는 방향으로 연구를 확장해 왔다. 학술대회 발표 주제인 반복측정자료를 위한 의사결정나무, 중도절단자료를 위한 median regression tree, 다중 분위수 회귀트리, 혼합효과 회귀모형 기반 트리 구조화 등은 이러한 흐름을 잘 보여준다. 이는 기존 의사결정나무가 다루기 어려웠던 시간적 상관성, 검열, 이질적 분산 구조를 통계적으로 정교하게 반영하려는 시도라고 볼 수 있다. 이러한 연구는 해석력과 실용성이 중요한 의학, 보건, 산업 데이터 분석에 특히 유용하다. 연구실의 방법론은 고차원 데이터에서도 중요한 변수를 선별하고, 비선형 관계와 상호작용을 탐색하며, 임상 의사결정이나 위험도 분류에 직접 활용될 수 있다는 점에서 응용 가치가 높다. 앞으로도 설명 가능한 인공지능, 맞춤형 예측모형, 고차원·시계열·다변량 자료 통합 분석과 연결되며 통계적 데이터마이닝 분야에서 중요한 기반 기술로 발전할 가능성이 크다.

의사결정나무데이터마이닝분류모형종단자료생존분석
2

통계적 바이오인포매틱스와 오믹스 데이터 분석

조형준 연구실의 또 다른 대표 연구 축은 바이오인포매틱스와 오믹스 데이터에 대한 통계적 분석이다. 「바이오정보학」, 「Statistical Bioinformatics: For Biomedical and Life Science Researchers」, 「Statistical Analysis in Proteomics: Methods and Protocols」와 같은 저서는 연구실이 생명과학 데이터를 위한 통계 방법론을 체계적으로 연구해 왔음을 보여준다. 이는 단순한 데이터 처리 수준을 넘어 유전체, 단백질체, 분자생물학 데이터에서 생물학적 신호를 추론하고 해석하는 통계적 기반을 구축하는 연구라고 할 수 있다. 특히 고처리량 유전체·단백질체 데이터는 변수 수가 매우 많고 잡음과 이상치가 많으며 표본 수는 제한적인 경우가 많다. 연구실은 마이크로어레이 자료의 강건한 분류모형, 고차원 고처리량 데이터에서의 이상치 탐지, 질량분석 데이터 분석, 유전학 및 유전체학에서의 메타분석 등 다양한 주제를 다루며 이러한 문제를 해결해 왔다. 이는 생명과학 연구에서 재현 가능성을 높이고, 복잡한 분자 수준 정보를 질병 이해 및 바이오마커 발굴로 연결하는 데 필수적인 접근이다. 이 연구 방향은 의생명 데이터의 정밀 분석을 통해 질병 메커니즘 규명, 환자군 분류, 예후 인자 탐색에 기여할 수 있다. 실제로 연구실의 논문 및 특허 이력은 암 관련 분자표지자와 예후 예측 문제에 통계적 분석이 적극적으로 적용되고 있음을 시사한다. 향후에는 멀티오믹스 통합 분석, 정밀의료, 바이오마커 검증, 임상 데이터와 분자 데이터의 연결 분석 등으로 확장되며 통계학과 생명과학의 융합 연구를 선도할 수 있는 기반이 될 것이다.

바이오인포매틱스유전체단백질체고차원데이터바이오마커
3

의생명·임상 데이터의 통계적 예후 예측과 메타분석

조형준 연구실은 통계학적 방법을 의학 및 임상 문제에 적용하여 질병 예후 예측과 치료 효과 평가를 수행하는 연구도 활발히 전개하고 있다. 연구실의 논문들은 대장선종 및 선암, 위 림프종, 위암, 위장관 유암종, 장 T세포 림프종 등 다양한 암종을 다루고 있으며, 특허에서는 췌장암 환자의 재발 예측 방법을 제시하고 있다. 이는 연구실이 임상 현장에서 발생하는 실제 의사결정 문제를 통계적 모델링으로 해결하려는 응용 지향적 성격을 갖고 있음을 보여준다. 이 연구는 분자생물학적 지표와 임상 결과를 연결하는 데 초점을 둔다. 예를 들어 KRAS 돌연변이와 같은 분자 표지자의 정량 정보를 바탕으로 재발 위험을 예측하거나, 치료 방식에 따른 임상 결과를 비교하고, 항암제 및 항체 치료의 반응성을 분석하는 접근이 포함된다. 또한 유전학·유전체학 분야의 메타분석 연구는 개별 연구를 넘어서 여러 연구 결과를 통합함으로써 보다 신뢰도 높은 근거를 도출하려는 방향을 반영한다. 이러한 연구는 정밀의료 시대에 매우 중요한 의미를 가진다. 환자별 분자 특성과 임상 경과를 함께 고려한 통계 모델은 치료 전략의 최적화, 고위험군 조기 선별, 예후 예측 정확도 향상에 기여할 수 있다. 나아가 임상시험 자료, 전자의무기록, 분자진단 데이터를 통합하는 방향으로 발전하면 실제 의료현장에서 사용 가능한 의사결정지원 도구 개발로 이어질 수 있으며, 통계학의 사회적 기여를 직접적으로 확장하는 연구 분야가 될 수 있다.

예후예측임상통계메타분석정밀의료암연구