다수의 연구에서 다중 회귀 모형을 이용하여 엽록소-a 농도를 예측하고, 홀드아웃 기법으로 이를 검증해 왔다. 본 연구에서는 한국 낙동강의 엽록소-a 농도를 예측하기 위해 지지벡터회귀(Support Vector Regression), 배깅(Bagging), 랜덤 포레스트(Random Forest), 극한 그래디언트 부스팅(Extreme Gradient Boosting, XGBoost), 순환신경망(Recurrent Neural Network, RNN), 장단기기억(Long–Short-Term Memory, LSTM)과 같은 널리 사용되는 기계학습 모형을 활용하여 새로운 예측 모형을 구축하였다. 본 연구에서는 시계열 자료의 특성을 반영하기 위해 1-step ahead 재귀적 예측(1–step ahead recursive prediction)을 사용하였다. 예측 정확도를 향상시키기 위해 모형 구축은 순방향 변수 선택(forward variable selection)에 기반하여 수행하였다. 적합된 모형들은 홀드아웃 기법 대신 누적 학습(cumulative learning) 및 롤링 윈도우 학습(rolling window learning) 방법을 통해 검증하였다. RNN 모형과 롤링 윈도우 학습 방법을 결합하여 엽록소-a 농도를 예측할 때 가장 우수한 결과가 얻어졌다. 이러한 결과는 기계학습 모형에서 설명변수의 선택과 1-step ahead 재귀적 예측이 예측 성능을 향상시키는 데 중요한 과정임을 시사한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.