임성훈 교수 연구실
기본 정보
연구 분야
프로젝트
논문
구성원
article|
인용수 0
·2026
Infinite-Story: A Training-Free Consistent Text-to-Image Generation
Jihun Park, Kyoungmin Lee, Jongmin Gim, Hyeonseo Jo, Minseok Oh, Wonhyeok Choi, Kyumin Hwang, Jaeyeul Kim, Minwoo Choi, Sunghoon Im
Proceedings of the AAAI Conference on Artificial Intelligence
초록

우리는 다중 프롬프트 스토리텔링 시나리오에 맞춤화된, 학습 없이도 일관된 텍스트-대-이미지(T2I) 생성을 가능하게 하는 훈련 비의존 프레임워크인 Infinite-Story를 제시한다. 우리는 스케일 단위의 자기회귀 모델을 기반으로 하여, 일관된 T2I 생성에서의 두 가지 핵심 과제—정체성 불일치와 스타일 불일치—를 다룬다. 이러한 문제를 해결하기 위해 세 가지 상호보완적 기법을 도입한다. 첫째, Identity Prompt Replacement는 텍스트 인코더에서의 문맥 편향을 완화하여 프롬프트 전반에 걸쳐 정체성 특성을 정렬한다. 둘째, Adaptive Style Injection과 Synchronized Guidance Adaptation으로 구성된 통합 어텐션 가이던스 메커니즘은 프롬프트 충실도를 보존하면서 전역 스타일과 정체성의 외양 일관성을 함께 강제한다. 미세조정이 필요하거나 느린 추론을 겪는 기존 확산 기반 접근법과 달리, Infinite-Story는 전적으로 테스트 시점에서만 작동하며 다양한 프롬프트에 대해 높은 정체성과 스타일 일관성을 제공한다. 광범위한 실험 결과, 본 방법은 생성 성능에서 최첨단 수준을 달성함과 동시에, 기존의 가장 빠른 일관된 T2I 모델보다 6배 이상 빠른 추론(이미지당 1.72초)을 제공하는 것으로 나타나, 실현 가능성과 효과를 실세계 시각적 스토리텔링에 걸쳐 입증한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Identity (music)Consistency (knowledge bases)Context (archaeology)Style (visual arts)Key (lock)
타입
article
IF / 인용수
- / 0
게재 연도
2026

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.