주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
article
|
인용수 0
·
2026Delaunay Canopy: Building Wireframe Reconstruction from Airborne LiDAR Point Clouds via Delaunay Graph
DongHyun Kim, Chanyoung Kim, Youngjoong Kwon, Seong Jae Hwang
arXiv (Cornell University)
항공 LiDAR 점군으로부터 건물 와이어프레임을 재구성하면, 조밀한 메시를 넘어 구조적 이해를 가능하게 하는 컴팩트하고 위상 중심적인 표현을 얻을 수 있다. 그러나 중요한 한계가 여전히 남아 있다. 즉, 기존 방법들은 상당한 잡음, 희소성 또는 내부 코너가 존재하는 영역에서 정확한 와이어프레임 재구성을 달성하지 못했다. 이러한 실패는, 대규모이고 희소한 건물 점군의 풍부한 3차원 기하 정보를 효과적으로 활용하기 위한 적응형 탐색 공간을 설정하지 못하기 때문이다. 본 연구에서는 이 문제를 Delaunay Canopy로 해결한다. Delaunay Canopy는 기하학적 선행정보로 Delaunay 그래프를 활용하여 기하학적으로 적응적인 탐색 공간을 정의한다. 우리의 접근에서 핵심은 Delaunay Graph Scoring이며, 이는 단지 기저의 기하학적 다양체를 재구성하는 데 그치지 않고 영역 단위 곡률 서명을 산출하여 재구성을 견고하게 안내한다. 이러한 기반 위에서 코너 및 와이어 선택 모듈은 Delaunay로 유도된 선행정보를 활용하여 높은 가능성을 갖는 요소들에 초점을 맞추고, 따라서 탐색 공간을 형성하며 이전에는 다루기 어려웠던 영역에서도 정확한 예측을 가능하게 한다. Building3D Tallinn 도시 데이터와 엔트리 레벨 데이터셋에 대한 광범위한 실험 결과, 최신 수준의 와이어프레임 재구성을 보이며 다양한 복잡한 건물 형상에 걸쳐 정확한 예측을 제공함을 확인하였다.
http://arxiv.org/abs/2604.02497
Delaunay triangulation
Point cloud
Leverage (statistics)
Curvature
Graph
Constrained Delaunay triangulation
Focus (optics)
Point (geometry)
2
preprint
|
인용수 0
·
2026Delaunay Canopy: Building Wireframe Reconstruction from Airborne LiDAR Point Clouds via Delaunay Graph
DongHyun Kim, Chanyoung Kim, Youngjoong Kwon, Seong Jae Hwang
arXiv (Cornell University)
비행체 탑재 LiDAR 포인트 클라우드로부터 건물 와이어프레임을 재구성하면, 조밀한 메쉬를 넘어 구조적 이해를 가능하게 하는 압축적이고 토폴로지 중심의 표현을 얻을 수 있다. 그러나 핵심적인 한계가 여전히 존재한다. 즉, 기존 방법들은 상당한 잡음, 희소성, 또는 내부 코너가 존재하는 영역에서 정확한 와이어프레임 재구성을 달성하지 못했다. 이러한 실패는 크고 희소한 건물 포인트 클라우드의 풍부한 3차원 기하 정보를 효과적으로 활용할 수 있도록 적응형 탐색 공간을 설정하지 못하기 때문이다. 본 연구에서는 이러한 문제를 Delaunay Canopy로 해결한다. Delaunay Canopy는 기하학적 선행정보로 Delaunay 그래프를 활용하여 기하학적으로 적응적인 탐색 공간을 정의한다. 우리의 접근에서 중심이 되는 Delaunay Graph Scoring은 단지 기저 기하학적 다양체를 재구성하는 데 그치지 않고, 영역 단위 곡률 시그니처를 산출하여 재구성을 견고하게 안내한다. 이러한 기반 위에서 코너 및 와이어 선택 모듈은 Delaunay 유도 선행정보를 활용하여 높은 확률을 갖는 요소들에 초점을 맞춤으로써 탐색 공간을 형성하고, 이전에는 다루기 어려웠던 영역에서도 정확한 예측을 가능하게 한다. Building3D Tallinn 도시 데이터와 엔트리 레벨 데이터셋에 대한 광범위한 실험 결과, 최신 수준의 와이어프레임 재구성이 입증되었으며, 다양한 복잡한 건물 형상에 걸쳐 정확한 예측을 제공한다.
https://doi.org/10.48550/arxiv.2604.02497
Delaunay triangulation
Point cloud
Leverage (statistics)
Curvature
Graph
Constrained Delaunay triangulation
Focus (optics)
Point (geometry)
3
article
|
·
인용수 3
·
2025Distilling Spectral Graph for Object-Context Aware Open-Vocabulary Semantic Segmentation
Chanyoung Kim, Dayun Ju, Woojung Han, Ming–Hsuan Yang, Seong Jae Hwang
개방 어휘 의미 분할(Open-Vocabulary Semantic Segmentation, OVSS)은 최근의 비전-언어 모델(Vision-Language Models, VLMs)과 함께 발전하여, 다양한 학습 체계를 통해 사전에 정의된 범주를 넘어 분할을 수행할 수 있게 되었다. 특히 학습 없이 수행하는 훈련-프리(training-free) 방법은, OVSS의 핵심 목표인 보이지 않는 데이터를 처리하기 위한 확장 가능하고 손쉽게 배포할 수 있는 해결책을 제공한다. 그러나 여전히 중요한 문제가 남아 있는데, 이는 임의의 질의 프롬프트를 기반으로 OVSS의 도전적인 환경에서 복잡한 객체를 분할할 때 객체 수준의 문맥을 고려하지 않는다는 점이다. 이러한 간과는, 객체 내에서 의미적으로 일관된 요소들을 묶고 이를 사용자가 정의한 임의의 클래스에 정확히 대응시키는 모델의 능력을 제한한다. 본 연구에서는 이러한 한계를 극복하기 위해 이미지 안에 객체 수준의 맥락 정보를 통합하는 새로운 접근법을 제안한다. 구체적으로, 제안하는 모델은 시각 인코더의 어텐션 메커니즘에 비전 파운데이션 모델로부터 스펙트럼 기반 특징을 증류(distillation)함으로써 객체 내부의 일관성을 향상시켜, 의미적으로 일관된 구성 요소들이 하나의 객체 마스크를 형성하도록 한다. 또한 텍스트 임베딩을 제로샷 객체 존재 가능도(zero-shot object presence likelihood)로 정교화하여, 이미지에 나타난 특정 객체들과의 정렬(alignment)을 정확히 보장한다. 객체 수준의 문맥 정보를 활용함으로써, 본 접근법은 다양한 데이터셋에 걸친 강한 일반화 성능과 함께 최첨단(state-of-the-art) 성과를 달성한다.
https://doi.org/10.1109/cvpr52734.2025.01400
Computer science
Vocabulary
Graph
Artificial intelligence
Segmentation
Natural language processing
Context (archaeology)
Object (grammar)
Theoretical computer science
Linguistics
4
article
|
인용수 9
·
2024Complementary branch fusing class and semantic knowledge for robust weakly supervised semantic segmentation
Woojung Han, Seil Kang, Kyobin Choo, Seong Jae Hwang
IF 7.6 (2024)
Pattern Recognition
영상 수준 클래스 지식으로부터 유의미하게 정확한(pseudo) 마스크를 도출하여 분할에 활용하는 기법, 즉 영상 수준 약지도 의미 분할(image-level Weakly Supervised Semantic Segmentation, WSSS)은 여전히 어렵다. CNN을 사용하는 클래스 활성화 맵(Class Activation Maps, CAMs)은 사람의 얼굴만처럼 특정 클래스의 부분에 초점을 맞춤으로써 WSSS를 향상시키는 반면, 비전 트랜스포머(Vision Transformers, ViT)는 더 넓은 의미적 부분을 포착하지만 사람의 몸과 같은 클래스 전체에 대해, 개와 같은 인접한 물체를 포함한 완전한 클래스 특이 세부 정보를 종종 놓친다. 본 연구에서는 CNN으로부터의 클래스 지식과 ViT로부터의 의미론적 지식을 상호 보완적으로 제공하는 두 가지 서로 다른 아키텍처로 구성된 새로운 쌍(dual) 분기 프레임워크인 Co mplementary Bra nch(CoBra)를 제안한다. 구체적으로, CNN 분기에는 클래스 인지 투영(Class-Aware Projection, CAP)을, ViT 분기에는 의미 인지 투영(Semantic-Aware Projection, SAP)을 학습하고, 이들의 통찰을 결합하여 새로운 패치 수준 감독을 가능하게 하며, 클래스와 의미 정보를 통합하는 효과적인 유사 마스크를 생성한다. 광범위한 실험을 통해 각 분기가 서로 어떻게 보완하는지를 정성적 및 정량적으로 면밀히 분석하였고, 유의미한 결과를 보였다. 프로젝트 페이지와 코드는 다음에 제공된다: https://micv-yonsei.github.io/cobra2024/ . • 본 연구는 Complementary Branch Framework인 CoBra를 제안하며, CNN과 ViT의 강점을 활용하고 최대화하는 동시에 서로의 한계를 보완한다. • 각각 클래스 정보와 의미 정보를 포착하기 위해 Class-Aware Projection(CAP)과 Semantic-Aware Pro- jection(SAP)을 사용하고, 대조 학습(contrastive learning)을 통해 CNN 및 ViT 분기 모두에 대해 향상되고 보완적인 지침을 제공한다. • 본 모델의 영상 수준 WSSS 성능을 PASCAL VOC 2012 데이터셋 및 MS-COCO 2014에서 평가하였으며, seed, mask 및 분할 결과 전반에서 유의미한 성과를 보인다.
https://doi.org/10.1016/j.patcog.2024.110922
Segmentation
Artificial intelligence
Computer science
Class (philosophy)
Pattern recognition (psychology)
Natural language processing
5
article
|
인용수 107
·
2023Domain adversarial neural networks for domain generalization: when it works and how to improve
Anthony Sicilia, Xingchen Zhao, Seong Jae Hwang
IF 4.3 (2023)
Machine Learning
이론적으로 도메인 적응(domain adaptation)은 잘 연구된 문제이다. 또한 이러한 이론은 실제에서 잘 활용되어 왔다. 특히 Ben-David 등(Ben-David et al., Mach Learn 79(1–2):151–175, 2010)이 제시한 목표 오류(target error)에 대한 상한(bound)을 주목하며, 이 연구를 기반으로 한 도메인 정렬(domain-aligning) 알고리즘인 Domain Adversarial Neural Networks(DANN)를 Ganin과 Lempitsky(International conference on machine learning, pp 1180–1189)에서 제안한 바 있다. 최근에는 도메인 일반화(domain generalization)라는 관련 문제에 대해 DANN의 여러 변형들이 제안되었으나, 원래의 동기 부여가 된 상한에 대해서는 충분히 논의되지 않았다. 본 논문에서는 이러한 관점에서 도메인 일반화에서 DANN의 타당성을 조사한다. DANN을 적용하는 것이 타당한 조건들을 규명하고, 나아가 훈련 중 DANN을 동적 과정으로서 고려한다. 우리의 조사 결과는, 도메인 일반화에 DANN을 적용하는 일이 겉보기보다 단순하지 않을 수 있음을 시사한다. 이를 해결하기 위해, 도메인 일반화의 경우에 해당하는 DANN에 대한 알고리즘적 확장을 설계한다. 실험을 통해 이론과 알고리즘 모두를 검증한다.
https://doi.org/10.1007/s10994-023-06324-x
Generalization
Domain (mathematical analysis)
Computer science
Adversarial system
Artificial intelligence
Perspective (graphical)
Artificial neural network
Domain adaptation
Machine learning
Algorithm