연구 영역
기본 정보
논문·특허
과제
구성원
Article|
인용수 107
·2020
Prediction of Chlorophyll-a Concentrations in the Nakdong River Using Machine Learning Methods
Yuna Shin, Taekgeun Kim, Seoksu Hong, Seoksu Hong, Seulbi Lee, Eunji Lee, Seungwoo Hong, Seungwoo Hong, ChangSik Lee, TaeYeon Kim, Man Sik Park, Jungsu Park, Tae‐Young Heo
IF 3.103 (2020) Water
초록

다수의 연구에서 다중 회귀 모형을 이용하여 엽록소-a 농도를 예측하고, 홀드아웃 기법으로 이를 검증해 왔다. 본 연구에서는 한국 낙동강의 엽록소-a 농도를 예측하기 위해 지지벡터회귀(Support Vector Regression), 배깅(Bagging), 랜덤 포레스트(Random Forest), 극한 그래디언트 부스팅(Extreme Gradient Boosting, XGBoost), 순환신경망(Recurrent Neural Network, RNN), 장단기기억(Long–Short-Term Memory, LSTM)과 같은 널리 사용되는 기계학습 모형을 활용하여 새로운 예측 모형을 구축하였다. 본 연구에서는 시계열 자료의 특성을 반영하기 위해 1-step ahead 재귀적 예측(1–step ahead recursive prediction)을 사용하였다. 예측 정확도를 향상시키기 위해 모형 구축은 순방향 변수 선택(forward variable selection)에 기반하여 수행하였다. 적합된 모형들은 홀드아웃 기법 대신 누적 학습(cumulative learning) 및 롤링 윈도우 학습(rolling window learning) 방법을 통해 검증하였다. RNN 모형과 롤링 윈도우 학습 방법을 결합하여 엽록소-a 농도를 예측할 때 가장 우수한 결과가 얻어졌다. 이러한 결과는 기계학습 모형에서 설명변수의 선택과 1-step ahead 재귀적 예측이 예측 성능을 향상시키는 데 중요한 과정임을 시사한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Computer scienceRandom forestMachine learningRecurrent neural networkArtificial intelligenceArtificial neural networkSupport vector machineRegressionGradient boostingRegression analysis
타입
Article
IF / 인용수
3.103 / 107
게재 연도
2020