연구 영역
기본 정보
논문·특허
구성원
Preprint|
인용수 1
·2025
Enhancing Variational Autoencoders with Smooth Robust Latent Encoding
Hyomin Lee, Minseon Kim, Sangwon Jang, Jongheon Jeong, Sung Ju Hwang
ArXiv.org
초록

변분 오토인코더(Variational Autoencoders, VAEs)는 Stable Diffusion과 같은 확산 기반 생성 모델의 확장에 핵심적인 역할을 해왔으나, 그 견고성에 관한 질문은 대체로 충분히 탐구되지 않은 상태이다. 예측 모델에서 견고성을 향상시키기 위한 적대적 학습(adversarial training)은 확립된 기법이지만, 성능과 견고성 사이의 상충(trade-off)이라는 특성상 생성 충실도(fidelity)가 저하될 수 있다는 우려 때문에 생성 모델에서는 간과되어 왔다. 본 연구에서는 이러한 전제를 반박하며, 생성 품질과 견고성 모두를 향상시키는 새로운 적대적 학습 프레임워크인 Smooth Robust Latent VAE(SRL-VAE)를 제안한다. 견고성만을 목표로 하는 기존 적대적 학습과 달리, 우리의 접근법은 적대적 섭동을 통해 잠재 공간(latent space)을 매끄럽게(smooth) 하여 보다 일반화 가능한 표현을 촉진하는 한편, 원본 충실도(original fidelity)를 유지하기 위해 originality representation으로 정규화한다. 사전 학습된 VAEs에 대한 후처리(post-training) 단계로 적용할 때, SRL-VAE는 최소한의 계산 오버헤드로 이미지의 견고성과 충실도를 모두 향상시킨다. 실험 결과, SRL-VAE는 Nightshade 공격 및 이미지 편집 공격에 대해 생성 품질(이미지 재구성과 텍스트 유도 이미지 편집)과 견고성 모두를 개선하는 것으로 나타났다. 이러한 결과는 생성 모델에 해로울 것이라 여겨졌던 적대적 학습이 오히려 충실도와 견고성 모두를 향상시킬 수 있음을 보여주는 새로운 패러다임을 정립한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Robustness (evolution)Adversarial systemFidelityGenerative grammarHigh fidelityPattern recognition (psychology)Generative model
타입
Preprint
IF / 인용수
- / 1
게재 연도
2025