랜덤 포레스트 및 딥 포레스트와 같은 트리 기반 알고리즘에서는 모델에 다수의 비효율적인 트리와 포레스트가 존재함에 따라 계산 부하가 증가하고 효율이 저하된다. 이러한 문제를 해결하기 위해, 본 논문에서는 수축(shrinkage) 기법을 기반으로 하는 Automatic Deep Forest Shrinkage (ADeFS)라는 모델을 제안한다. 이 모델의 목적은 트리의 수를 줄이고, gcforest의 효율을 향상시키며, 계산 부하를 감소시키는 데 있다. 제안된 모델은 네 단계로 구성된다. 첫 번째 단계는 멀티-그레인 스캐닝(multi-grained scanning)으로, 입력 데이터를 스캔하고 특징(feature) 간의 관계를 추출하기 위해 슬라이딩 윈도우 전략을 수행한다. 두 번째 단계는 캐스케이드 포레스트(cascade forest)로, 각 층(layer) 내에 랜덤 포레스트(RF)와 완전 랜덤 포레스트(CRF)로 구성된 복수의 포레스트를 두고 층별로 계층적으로 구조화한다. 세 번째 단계는 본 논문의 혁신으로, LASSO 및 elastic net (EN)과 같은 수축 기법을 이전 단계의 마지막 층에서의 트리 수를 감소시키는 데 사용함으로써 계산 부하를 줄이고 gcforest의 성능을 향상시킨다. 여러 수축 기법 중 elastic net (EN)이 더 나은 성능을 제공한다. 마지막으로, 마지막 단계에서는 단순 평균 앙상블 방법을 사용하여 남아 있는 트리를 결합한다. 제안된 모델은 몬테카를로 시뮬레이션과 세 가지 실제 데이터셋을 통해 평가되었다. 그 결과, 제안된 ADeFS-EN 모델은 gcforest 및 RF 모두에 비해 우수한 성능을 보였으며, 또한 RF에 수축 기법을 결합한 경우에 대해서도 더 나은 성능을 나타냈다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.