주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
preprint
|
인용수 0
·
2025LRSLAM: Low-rank Representation of Signed Distance Fields in Dense Visual SLAM System
Hongbeen Park, Minjeong Park, Giljoo Nam, Jinkyu Kim
ArXiv.org
동시적 위치추정 및 지도작성(Simultaneous Localization and Mapping, SLAM)은 자율주행, 모바일 로보틱스, 혼합현실 등 다양한 분야에서 핵심적인 역할을 해왔다. RGB-D 카메라 시스템을 활용하는 밀집 시각 SLAM은 장점을 제공하지만, 대규모 장면에 대해 실시간 성능, 강건성, 확장성을 달성하는 데 어려움이 있다. 최근에는 신경 암시적 장면 표현을 사용하는 접근들이 가능성을 보이지만, 높은 계산 비용과 메모리 요구량이라는 한계를 겪는다. ESLAM은 평면 기반 텐서 분해를 도입했으나, 여전히 메모리 증가 문제로 어려움을 겪었다. 이러한 과제를 해결하기 위해, 저랭크 텐서 분해 기법을 활용하는 보다 효율적인 시각 SLAM 모델인 LRSLAM을 제안한다. 우리의 접근은 6축(Six-axis)과 CP 분해를 활용함으로써, 기존의 최신 기술 대비 더 나은 수렴 속도, 메모리 효율성, 그리고 재구성/위치추정 품질을 달성한다. 다양한 실내 RGB-D 데이터셋에 대한 평가는 LRSLAM이 매개변수 효율성, 처리 시간, 정확도 측면에서 우수한 성능을 보이며, 재구성 및 위치추정 품질을 유지함을 보여준다. 본 연구의 코드는 출판 시 공개될 예정이다.
http://arxiv.org/abs/2506.10567
Scalability
Representation (politics)
Code (set theory)
Decomposition
Convergence (economics)
Tensor (intrinsic definition)
Simultaneous localization and mapping
Tensor decomposition
2
book-chapter
|
·
인용수 14
·
2024VisionTrap: Vision-Augmented Trajectory Prediction Guided by Textual Descriptions
Seokha Moon, Hyun Woo, Hongbeen Park, Haeji Jung, Reza Mahjourian, Hyung‐gun Chi, Hyerin Lim, Sangpil Kim, Jinkyu Kim
Lecture notes in computer science
https://doi.org/10.1007/978-3-031-72658-3_21
Computer science
Trajectory
Artificial intelligence
Computer vision
Computer graphics (images)
3
article
|
인용수 4
·
2024Audio-guided implicit neural representation for local image stylization
Seung Hyun Lee, Sieun Kim, Wonmin Byeon, Gyeongrok Oh, Sumin In, Hyeongcheol Park, Sang Ho Yoon, Sunghee Hong, Jinkyu Kim, Sangpil Kim
IF 18.3 (2024)
Computational Visual Media
우리는 음성 유도를 통한 국소화 이미지 스타일화(audo-guided localized image stylization)를 위한 새로운 프레임워크를 제안한다. 소리는 장면의 특정 맥락에 관한 정보를 제공하며, 장면의 특정 부분 또는 대상과 밀접하게 연관되어 있다. 그러나 기존의 이미지 스타일화 연구들은 이미지 또는 텍스트 입력을 사용하여 전체 이미지를 스타일화하는 데에 초점을 맞춰 왔다. 음성 입력에 따라 이미지의 특정 부분을 스타일화하는 것은 자연스러우나 도전적이다. 본 연구는 사용자가 음성 입력을 제공하여 입력 이미지에서 목표를 국소화하고, 동시에 목표 대상 또는 장면을 음성에 근거해 국소적으로 스타일화하도록 하는 프레임워크를 제안한다. 먼저 CLIP 임베딩 공간을 활용하는 오디오-비주얼 국소화 네트워크를 통해 정밀한 국소화 맵(fine localization map)을 생성한다. 이후 예측된 국소화 맵과 함께 암시적 신경 표현(implicit neural representation, INR)을 이용하여 음성 정보에 기반해 목표를 스타일화한다. INR은 제공된 음성 입력과 의미적으로 일관되도록 국소 픽셀 값을 조작한다. 실험 결과, 제안한 프레임워크는 다른 음성 유도 스타일화 방법들보다 우수한 성능을 보였다. 또한, 본 방법은 간결한 국소화 맵을 구성하고 주어진 음성 입력에 따라 목표 대상 또는 장면을 자연스럽게 조작함을 관찰하였다.
https://doi.org/10.1007/s41095-024-0413-5
Representation (politics)
Computer science
Computer graphics
Image (mathematics)
Computer graphics (images)
Graphics
Artificial intelligence
Computer vision
Artificial neural network
4
article
|
·
인용수 2
·
2024Robust sound-guided image manipulation
Seung Hyun Lee, Hyung‐gun Chi, Gyeongrok Oh, Wonmin Byeon, Sang Ho Yoon, Hyunje Park, Wonjun Cho, Jinkyu Kim, Sangpil Kim
IF 6.3 (2024)
Neural Networks
https://doi.org/10.1016/j.neunet.2024.106271
Computer science
Artificial intelligence
Image (mathematics)
Sound (geography)
Computer vision
Acoustics
5
article
|
·
인용수 5
·
2024FPANet: Frequency-based video demoiréing using frame-level post alignment
Gyeongrok Oh, Sungjune Kim, Sungjune Kim, Heon Gu, Sang Ho Yoon, Jinkyu Kim, Sangpil Kim, Sangpil Kim
IF 6.3 (2024)
Neural Networks
https://doi.org/10.1016/j.neunet.2024.107021
Computer science
Frame (networking)
Artificial intelligence
Computer vision
Pattern recognition (psychology)
Telecommunications