최근의 생성적 신경망 모델의 발전은 데이터 증강 방법의 개발을 확장해 왔다. 그러나 현대적 생성 모델에 기반한 증강 방법은, 기존 모델인 Synthetic Minority Oversampling Technique (SMOTE)에 비해 클래스 불균형 데이터에서 두드러진 개선을 달성하지 못한다. 본 연구는 불균형 분류를 위한 생성 모델의 문제를 조사하고, Variational Autoencoders (VAE s)를 사용하여 SMOTE 알고리즘을 향상시키는 프레임워크를 제안한다. 우리의 접근법은 VAE를 통해 저차원 잠재 공간에서 데이터 포인트의 밀도를 체계적으로 정량화하는 한편, 클래스 라벨 정보와 분류 난이도 정보를 동시에 통합한다. 그다음 증강을 저하시킬 가능성이 있는 데이터 포인트를 체계적으로 제외하고, 데이터 공간에서 인접 관측치를 직접 증강한다. 여러 불균형 데이터셋에 대한 경험적 연구는, 이러한 단순한 과정이 딥러닝 모델에 비해 기존 SMOTE 알고리즘을 혁신적으로 개선함을 보여준다. 따라서 소수의 데이터 포인트를 가진 불균형 분류 문제에서, 소수(minority) 데이터의 선택과 데이터 공간에서의 보간이 유익하다는 결론을 내린다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.