연구 영역
기본 정보
논문·특허
과제
구성원
Article|
인용수 0
·2025
Is There a Better Source Distribution than Gaussian? Exploring Source Distributions for Image Flow Matching
Junho Lee, Kwanseok Kim, Joonseok Lee
ArXiv.org
초록

플로우 매칭(Flow matching)은 소스 분포의 선택이 유연하다는 점에서 강력한 생성 모델링 접근법으로 부상해 왔다. 가우시안 분포는 흔히 사용되지만, 고차원 데이터 생성에서 더 나은 대안이 있을 가능성은 상당 부분 탐구되지 않은 상태이다. 본 논문에서는 해석 가능한 2차원 설정에서 고차원 기하학적 특성을 포착하는 새로운 2D 시뮬레이션을 제안하여, 학습 과정 동안 플로우 매칭의 학습 역학을 분석할 수 있게 한다. 이러한 분석을 바탕으로 우리는 플로우 매칭의 거동에 관한 몇 가지 핵심 통찰을 도출하였다: (1) 밀도 근사는 모드 불일치로 인해 역설적으로 성능을 저하시킬 수 있고, (2) 방향 정렬은 과도하게 집중될 경우 경로가 얽히며 어려움을 겪으며, (3) 가우시안의 전방위적 포괄성은 견고한 학습을 보장하고, (4) 노름 정렬의 불일치는 상당한 학습 비용을 초래한다. 이러한 통찰에 기반하여, 우리는 노름 정렬 학습과 방향성 가지치기(directional pruning) 샘플링을 결합한 실용적인 프레임워크를 제안한다. 이 접근법은 안정적인 플로우 학습에 필수적인 견고한 전방위 감독을 유지하면서, 추론 시 데이터가 희소한 영역에서의 초기화를 제거한다. 중요하게도, 우리의 가지치기 전략은 가우시안 소스를 사용해 학습된 어떤 플로우 매칭 모델에도 적용 가능하며, 재학습 없이 즉각적인 성능 향상을 제공한다. 실험적 평가는 생성 품질과 샘플링 효율 모두에서 일관된 개선을 보여준다. 본 연구 결과는 소스 분포 설계에 관한 실용적 통찰과 지침을 제공하며, 기존 플로우 매칭 모델을 개선하기 위한 즉시 적용 가능한 기법을 제시한다. 코드는 https://github.com/kwanseokk/SourceFM 에서 제공된다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Matching (statistics)Source codeFlow (mathematics)GaussianKey (lock)Noise (video)PruningSampling (signal processing)Probability distributionGenerative model
타입
Article
IF / 인용수
- / 0
게재 연도
2025