Evaluation of Malware Classification Models for Heterogeneous Data | 배호 교수 연구실 | 이화여자대학교 사이버보안학과

|배호 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

Article|

인용수 7

·2024

Evaluation of Malware Classification Models for Heterogeneous Data

Ho Bae

IF 3.5 (2024) Sensors

초록

머신러닝(ML)은 다양한 분야에서 널리 활용되고 있다. 또한 ML 기반 기법은 기술 분야의 보안 문제를 해결하기 위해 사용되어 왔으며, 다수의 연구는 보안 문제를 해결하는 데 있어 그 잠재력과 효과를 보여주고 있다. 수년 동안 악성 소프트웨어를 식별하기 위한 ML 방법은 여러 보안 영역에 걸쳐 개발되어 왔다. 그러나 최근 연구에서는 ML 모델이 작은 입력 교란에 취약하다는 점이 강조되었으며, 이를 적대적 예(adversarial examples)라 한다. 이러한 적대적 예는 모델의 예측을 크게 변화시킬 수 있다. 기존의 적대적 예에 관한 연구는 주로 영상 처리용 ML 모델에 초점을 두었으나, 점차 보안을 포함한 다른 응용 분야로 확장되었다. 흥미롭게도 적대적 공격은 악성코드 분류(malware classification)의 영역에서 특히 효과적인 것으로 입증되었다. 본 연구는 악성코드 분류의 투명성을 탐구하고 악성코드 분류기(malware classifiers)를 위한 설명 방법을 개발하고자 한다. 현재의 과제는 전통적인 영상 데이터셋과 비교해 악성코드가 지닌 복잡한 데이터 구조로 인해, 동질적 데이터에 대한 설명가능 AI(explainable AI)에서의 과제보다 더 복잡하다. 연구 결과 기존의 설명들이 이질적 데이터(heterogeneous data)를 해석하는 데에는 한계가 있음을 확인하였다. 본 연구에서 사용한 방법은, 분류 정확도(classification accuracy)가 높더라도 현재의 악성코드 탐지기가 오히려 잘못된 형태의 보안감을 제공할 수 있으며, 분류 정확도의 측정만으로 탐지기를 검증하기에는 충분하지 않다는 점을 보여주었다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

MalwareComputer scienceAdversarial systemMachine learningArtificial intelligenceSoftwareAdversarial machine learningData miningComputer security

타입

Article

IF / 인용수

3.5 / 7

원문

https://doi.org/10.3390/s24010288

게재 연도

2024