연구 영역
기본 정보
논문·특허
과제
구성원
Article|
인용수 181
·2022
Classification and Explanation for Intrusion Detection System Based on Ensemble Trees and SHAP Method
Thi-Thu-Huong Le, Haeyoung Kim, Haeyoung Kim, Hyoeun Kang, Howon Kim, Howon Kim
IF 3.9 (2022) Sensors
초록

최근 몇 년 동안 침입 탐지 시스템(IDS)을 위한 많은 방법들이 연구 커뮤니티에서 설계되고 개발되었으며, IDS 데이터셋을 사용해 완벽한 탐지율을 달성한 바 있다. 심층 신경망(DNN)은 IDS에 널리 적용되는 대표적인 사례이다. 그러나 DNN 모델은 하드웨어 요구 사항에서 높은 연산 자원이 필요해지면서, 모델 아키텍처가 점차 복잡해지고 있다. 또한 대규모 IoT 기반 IDS 데이터셋을 사용한 이러한 DNN 모델의 결정에 대한 설명을 사람의 관점에서 얻는 것은 어렵다. 제안된 많은 IDS 방법들이 사이버보안 전문가에게 제공되는 설명의 부재로 인해 실제 배포에 적용되지 못한 경우가 많으며, 이는 IDS 모델의 판단에 따라 의사결정을 최적화하는 측면에서 이들을 지원하지 못했기 때문이다. 본 논문은 대규모 IoT 기반 IDS 데이터셋을 활용하여 IDS의 공격 탐지 성능을 향상시키는 동시에, 머신러닝(ML) 모델 예측에 대한 설명을 제공하는 것을 목표로 한다. 제안하는 ML 기반 IDS 방법은 앙상블 트리 접근법에 기반하며, 의사결정나무(DT)와 랜덤 포레스트(RF) 분류기를 포함하여 모델 학습에 고도의 연산 자원이 필요하지 않다. 또한 제안 방법의 실험적 평가는 두 개의 대규모 데이터셋 NF-BoT-IoT-v2와 NF-ToN-IoT-v2(기존 BoT-IoT 및 ToN-IoT 데이터셋의 새로운 버전)를 사용하며, 네트 플로우 미터의 특성(feature set)을 통해 수행한다. 아울러 IoTDS20 데이터셋도 실험에 사용한다. 나아가 SHapley additive exPlanations(SHAP)를 eXplainable AI(XAI) 방법론에 적용하여 DT 및 RF 모델의 분류 결정을 설명하고 해석한다. 이는 앙상블 트리 접근법의 최종 결정 해석에 효과적일 뿐만 아니라, 결과에 대한 설명을 바탕으로 사이버보안 전문가가 자신의 판단의 정확성을 신속하게 최적화하고 평가하는 데에도 지원을 제공한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Computer scienceIntrusion detection systemRandom forestArtificial intelligenceSet (abstract data type)Machine learningDecision treeTree (set theory)Big dataArtificial neural network
타입
Article
IF / 인용수
3.9 / 181
게재 연도
2022