정체와 장기간의 선박 대기 시간은 글로벌 무역에 도전 과제를 제기하며, 운영 비용과 비효율을 증가시킨다. 본 연구에서는 선박 대기 시간을 정확히 예측함으로써 항만 운영을 개선하기 위한 새로운 기계학습 기반 예측 접근법을 제안하였다. 121,401건의 항차(voyage) 기록으로 구성된 데이터셋을 사용하여, 전통적 모델, 앙상블 기반 모델, 딥러닝 모델을 포함한 총 9개의 회귀(regression) 모델을 평가하였다. Shapley additive explanation (SHAP)-기반 특성 선택은 일반적으로 해석 가능성을 높이기 위해 적용되며, 그 효과를 주성분분석(principal component analysis, PCA)-기반 차원 축소 및 비선택 방법과 비교하였다. XGBoost Regressor (XGBR)는 유전 알고리즘 기반 하이퍼파라미터 튜닝을 통해 최적화되었으며, 평균제곱오차(mean squared error, RMSE)를 20.9531에서 19.6387로, 평균절대오차(mean absolute error, MAE)를 13.6821에서 12.6753으로 감소시켰고, 결정계수(coefficient of determination, R²)를 0.2791에서 0.2949로 개선하였다. 랜덤 포레스트 회귀기(random forest regressor), XGBR, LightGBM 회귀기(LightGBM regressor), CatBoost 회귀기(CatBoost regressor)를 통합한 스태킹 앙상블(stacking ensemble) 모델은 성능을 향상시켜 RMSE 18.9023, MAE 12.3287, R² 0.3265를 달성하였다. 분산분석(ANOVA) 검정은 모델 성능 및 계산 복잡도에서 다수의 유의미한 차이를 확인하였다. 그 결과, 본 설정에서는 트리 기반 앙상블 모델이 딥러닝 모델보다 우수한 성능을 보였다. 제안된 접근법은 선제적 스케줄링을 가능하게 하고 정체를 감소시키며 비용 절감을 가져온다. 모델의 확장성은 광범위한 해상 물류 및 지능형 교통 시스템에 적합함을 시사한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.