Towards Flexible Time-to-event Modeling: Optimizing Neural Networks via Rank Regression | 최상범 교수 연구실 | 고려대학교 통계학과

|최상범 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

Preprint|

인용수 2

·2023

Towards Flexible Time-to-event Modeling: Optimizing Neural Networks via Rank Regression

Hyunjun Lee, Junhyun Lee, Taehwa Choi, Jaewoo Kang, Sangbum Choi

arXiv (Cornell University)

초록

사건 발생까지의 시간(time-to-event) 분석, 즉 생존 분석(survival analysis)은 일련의 특성(feature)이 주어졌을 때 사건의 발생 시간을 예측하는 것을 목표로 한다. 이 분야에서의 주요 과제 중 하나는 검열(censored)된 데이터에 대응하는 것으로, 이는 학습 알고리즘을 보다 복잡하게 만들 수 있다. Cox의 비례위험 모형과 가속 실패 시간(accelerated failure time, AFT) 모형과 같은 전통적인 방법들이 이 분야에서 널리 사용되어 왔으나, 종종 비례위험(proportional hazards) 가정이나 선형성(linearity)과 같은 가정을 요구한다. 특히 AFT 모형은 미리 지정된 모수적 분포 가정이 필요한 경우가 많다. 예측 성능을 향상시키고 엄격한 가정을 완화하기 위해 최근 몇 년간 위험(hazard) 기반 모형을 위한 많은 딥러닝 접근법들이 제안되었다. 그러나 위험 중심 방법과 비교할 때 AFT의 표현 학습은 단순성과 해석 가능성 측면에서 유리함에도 불구하고, 신경망 문헌에서 AFT에 대한 표현 학습은 널리 탐구되지 않았다. 본 연구에서는 사건 발생까지의 시간 예측을 위한 Deep AFT Rank-regression 모델인 DART(Deep AFT Rank-regression model for Time-to-event prediction; DART)를 제안한다. 이 모델은 표현 학습에 효율적이고 신뢰할 수 있는 Gehan의 순위 통계량(rank statistic)에 기반한 목적 함수를 사용한다. 또한 기준 사건 시간 분포를 수립할 필요성을 제거하는 것뿐 아니라, DART는 표준 AFT 모형에서 사건 시간을 직접 예측하는 것의 장점을 그대로 유지한다. 제안된 방법은 생존 시간 분포에 대해 어떠한 분포 가정도 부과하지 않는 AFT 모델링을 위한 준모수적(semiparametric) 접근법이다. 이는 기존의 신경망 기반 AFT 모형과 달리 추가적인 하이퍼파라미터나 복잡한 모델 아키텍처의 필요성도 없앤다. 다양한 벤치마크 데이터셋에 대한 정량적 분석을 통해, DART가 고처리량(high-throughput) 검열된 사건 발생까지의 시간 데이터에 대해 모델링할 수 있는 유의미한 잠재력을 지님을 보였다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

InterpretabilityComputer scienceEvent (particle physics)Artificial intelligenceArtificial neural networkMachine learningBenchmark (surveying)Accelerated failure time modelRepresentation (politics)Data mining

타입

Preprint

IF / 인용수

- / 2

원문

http://arxiv.org/abs/2307.08044

게재 연도

2023