최근 들어, 슬라이싱(slicing) 방법은 이미지, 사운드, 텍스트 데이터에 대한 생성 모델에서 성공적인 성과를 보여 왔으며, 주로 결합 분포 학습(joint distributional learning)에 초점을 맞추었다. 그러나 우리는 표 형태 데이터(tabular data)에 대해서는 슬라이싱 접근법의 중대한 한계가 있음을 확인했다. 즉, 이는 효과적인 표 형태 데이터 합성(synthesis)에 중요한 주변(마진) 분포(marginal distributional) 패턴을 포착하는 데 어려움을 겪는다. 이러한 문제를 해결하기 위해, 혼합(mixture) 크라머–월드 거리(mixture Cramer–Wold distance)라는 새로운 불일치(discrepancy) 척도를 제안한다. 이 척도는 주변과 결합 분포 패턴을 동시에 포착할 수 있게 하여 두 측면 사이의 균형을 이루며, 그 적용에 대한 이론적 기반을 제공한다. 혼합 크라머–월드 거리의 강점을 활용하여, CWDAE(Cramer–Wold Distributional AutoEncoder)라는 생성 모델을 제시하며, 합성 표 형태 데이터를 생성하는 데서 주목할 만한 성능을 보인다. 또한 본 모델은 특정 요구에 맞추어 데이터 프라이버시 수준을 손쉽게 조정할 수 있는 유연성을 제공한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.