시스템 로그에서 이상 탐지 과제를 다루기 위한 복잡성을 해결하기 위해, 심층 학습 기반의 다수 방법들이 개발되어 왔으며, 그 과정에서 두 가지 중요한 과제가 제기된다. 첫째, 모델 복잡도와 하위 탐지 모델을 위한 의미론적으로 유의미한 표현을 생성하는 능력 사이의 균형을 맞추는 일은 섬세한 문제이다. 둘째, 이러한 방법들은 일반적으로 효과적인 학습을 위해 대규모의 라벨링 데이터에 의존한다. 이 두 과제를 각각 따로 해결하려는 노력에도 불구하고, 두 문제를 동시에 그리고 효율적으로 다루는 포괄적 해결책은 아직 부족하다. 이에 대응하여, 우리는 기존 방법들의 한계를 극복하기 위해 트랜스포머의 양방향 인코더 표현으로부터 컨텍스트 의미 정보 추출 능력을 활용하고, 시암 네트워크의 소수 샷 학습 능력을 결합한 종합적 솔루션인 SaRLog를 제안한다. 수축 손실(contractive loss)을 특징으로 하는 시암 네트워크는, 맞춤형 도메인 특화로 파인튜닝된 BERT 위에 구현된다. 비교 분석을 통해 SaRLog의 효과가 기존 기준선 방법들에 비해 검증되었으며, BGL 및 Thunderbird 데이터셋에서 각각 최대 31.2%와 46.7%의 F1 점수 향상을 보였다. 또한, 소수 샷 학습 능력을 평가하기 위한 추가 실험 분석은 SaRLog의 견고성과 일반화 효율성을 강조한다. 따라서 데이터셋 변동성을 극복하고 모델 일반화를 향상시킴으로써, SaRLog는 로그 이상 탐지를 진전시키며 복잡한 로그 데이터의 도전 과제를 효과적으로 처리한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.