Risk and damage modeling using zero-inflated two-part regression with penalized variable selection
연구 내용
제로-인플레이티드 두-부분 회귀와 패널나이즈드 추정으로 영(0)과 양(+)이 혼재된 손상·발생 데이터를 분석하여 위험과 비용을 정량화하는 연구
철도사고 손상이나 범죄 사건처럼 0이 다수 포함되고 양의 값이 연속적으로 관측되는 자료를 두-부분(two-part) 모형으로 분해하여 확률과 크기 성분을 각각 추정합니다. ZIP, ZINB, ZIG, ZILN 계열의 제로-인플레이티드 회귀를 적용해 발생 여부와 발생 후 크기를 동시에 모델링하며, 고차원 환경에서는 LASSO, ENET, SCAD, MCP와 같은 패널나이즈드 변수선택 전략의 예측 성능과 β-특이성을 비교합니다. 이를 통해 입력 데이터의 영 값 구조와 변수 선택의 편향을 함께 고려하는 분석 절차를 제공합니다.
관련 연구 성과
관련 논문
2편
관련 특허
0건
관련 프로젝트
0건
연구 흐름
초기에는 철도사고 자료에서 사고로 인한 지연 시간, 지연 횟수, 비용 등 반응의 분포 특성을 반영하기 위해 두-부분 모형과 제로-인플레이티드 회귀를 적용하는 방향으로 연구를 수행하였습니다. 이후 고차원 데이터에서 두-부분 모형의 변수선택이 안정적으로 작동하는지에 초점을 옮겨, 다양한 패널 함수 기반 추정치의 선택 특성과 예측 오차를 비교했습니다. 최근에는 사건·손상 평가에 필요한 모델링 구성요소를 정리하고, 실제 적용 시 제로 패턴을 포함한 데이터 설계 관점을 함께 제시하는 연구를 수행하고 있습니다.
활용 가능성
활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.
관련 논문
구분
제목
Analysis of the Railway Accident-Related Damages in South Korea
Variable selection and prediction performance of penalized two-part regression with community-based crime data application