스마트폰 사용의 급격한 증가는 악성 Android 애플리케이션의 동반적 증가로 이어졌으며, 따라서 높은 정확도를 갖추면서도 효율적이고 지속 가능한 악성코드 탐지 방법을 개발하는 것이 중요하다. 본 논문은 Android 악성코드 분류에서 탐지 정확도와 지속 가능성을 모두 향상시키기 위한 2단계 기계학습 접근법을 제시한다. 첫 번째 단계에서는 앱의 SDK 버전 정보로부터 해당 앱의 출시 연도를 추정하고, 두 번째 단계에서는 연도별 악성코드 탐지 모델에 가중 투표 메커니즘을 적용하여 앱을 정상 또는 악성으로 분류한다. 이 방법은 재학습의 높은 정확도와 연산 부담 감소를 균형 있게 결합하여 견고하고 확장 가능한 악성코드 탐지를 제공한다. 2014년부터 2023년까지의 데이터셋을 사용하여, 제안 방법의 성능을 재학습 및 점진 학습 접근법과 비교 평가하였다. 실험 결과, 재학습 방법이 가장 높은 정확도와 F1 점수를 달성하지만 훈련 시간이 유의미하게 증가하는 것으로 나타났다. 반면 점진 학습 방법은 정확도는 낮지만 훈련 시간은 더 짧다. 우리의 2단계 분류 방법은 이러한 상충 효과를 효과적으로 균형화하여 재학습과 비슷한 수준의 정확도를 제공하면서도, 훈련 시간은 안정적으로 유지되고 모델 크기는 중간 수준에 머물러 실제 환경에서의 지속 가능한 악성코드 탐지에 대한 실행 가능한 대안이 된다. 향후 연구에서는 훈련 효율을 더욱 최적화하고, 빠르게 변화하는 악성코드 탐지 환경에 대한 적응성을 개선하기 위해 비(非)기계학습 기반의 출시 연도 예측 방법을 탐색할 것이다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.