학업 성취 데이터는 학생의 중도탈락을 예측하는 모형을 구축하는 데 필수적이다. 데이터의 한 속성이 여러 값을 가지며, 각 값이 한 학기 동안 학생이 달성한 성취를 나타내는 경우, 기존 방법들은 통상 그 값들로부터 평균을 계산하고 이를 학습 데이터 구축에 사용한다. 이러한 요약 기반 접근은 특징 추출을 포함하여 학습 과정을 단순화할 수 있기 때문에 널리 사용되어 왔다. 그러나 여러 학기의 값에 내재된 패턴을 요약 대신 적절히 추출하여 학습에 활용할 수 있다면, 모형의 성능은 더욱 향상될 수 있다. 그럼에도 불구하고 이 문제는 선행 연구에서 조사되지 않았다. 본 논문에서는 학기별로 저장된 학생의 학업 기록에 존재하는 패턴을 활용하기 위해 순환신경망(recurrent neural networks, RNNs)을 효과적으로 사용할 수 있음을 입증한다. 데이터에서 패턴을 식별하고 이에 적합한 해법을 도출하기 위해 다양한 신경망 알고리즘을 비교하였다. 또한 모형 성능을 향상시키기 위해 어텐션을 채택하였다. 실제 학생 기록을 대상으로 수행한 실험에서, 멀티-헤드 어텐션을 적용한 게이트 순환 유닛(gate recurrent unit, GRU) 모형은 F1 점수 0.9416을 달성하였으며, 이는 기존의 요약 기반 접근법에 비해 약 5% 높은 결과이다. 이는 학기 기록이 시간적 패턴을 보이며, RNN이 이러한 패턴을 효과적으로 활용할 수 있음을 보여준다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.