공격 트래픽과 양성(benign) 트래픽 간 클래스 불균형으로 인해 암호화 네트워크 트래픽 분류에서 성능 저하가 발생하는 문제를 해결하기 위해, 시간-시계열 이중 스트림 아키텍처를 갖는 Transformer 기반 데이터 증강 프레임워크를 제안한다. 제안된 프레임워크는 단일 플로우 전체의 순차적 패킷 정보와 통계적 특성을 독립적으로 처리하며, 로컬 채널(패킷 크기, 인터어라이벌(inter-arrival) 시간, 방향을 포함)과 여섯 개의 전역 플로우 수준 통계 특징 세트를 추출하고 정규화한다. 이를 고정 길이의 다변량 시퀀스와 보조 벡터로 생성한 후, 인코더 전용 Transformer에 입력한다. 이 Transformer는 학습 가능한 위치 임베딩을 통합하고 FiLM + 컨텍스트 토큰 기반 주입 메커니즘을 적용하여, 순차 패턴과 전역 통계 분포의 상호 보완적 표현을 가능하게 한다. 대규모 실험 결과, 제안 방법은 원래의 불균형 데이터셋에서의 분류에 비해 재구성 RMSE와 추가적 특징 복원 MSE를 50% 이상 감소시키는 한편, 정확도, F1-Score, AUC를 5–7%p 향상시킨다. 또한 증강 과정은 실용 수준의 처리 시간 및 메모리 오버헤드를 달성한다. 이러한 결과는 제안 접근법이 암호화 트래픽 분류에서 클래스 불균형을 효과적으로 완화하며, 실제 배치 환경에서 보다 견고한 모델 일반화를 달성하기 위한 유망한 경로를 제공함을 보여준다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.