DiffuseHigh: Training-Free Progressive High-Resolution Image Synthesis Through Structure Guidance | 박은병 교수 연구실 | 연세대학교 인공지능학과

박은병 교수 연구실

홈

기본 정보

연구 분야

프로젝트

논문

구성원

article|

인용수 5

·2025

DiffuseHigh: Training-Free Progressive High-Resolution Image Synthesis Through Structure Guidance

Younghyun Kim, Geunmin Hwang, Junyu Zhang, Eunbyung Park

Proceedings of the AAAI Conference on Artificial Intelligence

초록

대규모 생성 모델(예: 텍스트-투-이미지 확산 모델)은 창의적이고 고품질의 이미지 생성을 통해 다양한 분야에서 큰 주목을 받아왔다. 그럼에도 불구하고 기존의 대규모 확산 모델은 최대 1K 해상도의 이미지만 생성할 수 있어, 오늘날의 현대적 상업 응용에서 요구하는 수준에는 크게 미치지 못한다. 더 높은 해상도의 이미지를 직접 샘플링하면 흔히 객체 반복, 형태 왜곡과 같은 아티팩트로 인해 결과가 손상된다. 이러한 문제를 해결하려면 통상적으로 더 높은 해상도의 데이터셋에 대해 모델을 학습하거나 미세조정해야 한다. 그러나 이는 대규모 고해상도 이미지를 수집하기 어렵고 막대한 계산 자원이 필요하다는 점에서 매우 도전적이다. 일부 선행 연구에서는 번거로운 학습 과정을 우회하는 대안을 제안했지만, 대체로 설득력 있는 결과를 도출하지 못한다. 본 연구에서는 원래의 능력을 넘어 더 높은 해상도에서 확산 모델의 생성 가능성을 탐구하고, 생성된 저해상도 이미지를 고해상도 이미지 생성에 충분히 활용하도록 하는 새로운 점진적(progressive) 접근법을 제안한다. 또한 파이프라인에 이미지 샤프닝(image sharpening) 연산을 통합하여 이미지 품질을 한층 더 향상시킨다. 우리의 방법은 추가적인 학습 또는 미세조정의 필요성을 없애며, 이로써 계산 비용의 부담을 크게 낮춘다. 대규모 실험과 결과를 통해 방법의 효율성과 효과를 검증하였다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Training (meteorology)Computer scienceComputer visionArtificial intelligenceGeography

타입

article

IF / 인용수

- / 5

원문

https://doi.org/10.1609/aaai.v39i4.32456

게재 연도

2025

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)