연구 영역
기본 정보
논문·특허
과제
구성원
Article|
인용수 3
·2025
AuxDepthNet: Real-Time Monocular 3D Object Detection with Depth-Sensitive Features
Ruochen Zhang, Hyeung‐Sik Choi, Dongwook Jung, Phan Huy Nam Anh, Sang-Ki Jeong, Zihao Zhu
IF 2.5 (2025) Applied Sciences
초록

단안 3D 물체 탐지는 단일 시점 이미지에서 명시적 깊이 정보가 부족하기 때문에 자율 시스템에서 어려운 과제이다. 기존 방법들은 종종 외부 깊이 추정기나 값비싼 센서에 의존하며, 이는 계산 복잡성을 증가시키고 기존 시스템에의 통합을 어렵게 만든다. 이러한 한계를 극복하기 위해, 우리는 외부 깊이 맵이나 사전 학습된 깊이 모델에 대한 의존을 제거한 실시간 단안 3D 물체 탐지 효율적 프레임워크인 AuxDepthNet을 제안한다. AuxDepthNet은 두 가지 핵심 구성요소를 도입한다. 첫째, 보조 깊이 특징(Auxiliary Depth Feature, ADF) 모듈은 깊이에 민감한 특징을 암묵적으로 학습하여 공간적 추론과 계산 효율을 향상시킨다. 둘째, 깊이 위치 매핑(Depth Position Mapping, DPM) 모듈은 깊이 위치 정보를 탐지 과정에 직접 내장하여 정확한 물체 위치 추정과 3D 바운딩 박스 회귀를 가능하게 한다. 깊이융합 트랜스포머(DepthFusion Transformer, DFT) 아키텍처를 활용하여, AuxDepthNet은 깊이 가이드 상호작용을 통해 시각 및 깊이 민감 특징을 전역적으로 통합함으로써 견고하고 효율적인 탐지를 보장한다. KITTI 데이터셋에 대한 광범위한 실험 결과, AuxDepthNet은 IoU 임계값 0.7에서 AP3D 24.72%(Easy), 18.63%(Moderate), 15.31%(Hard)와 APBEV 34.11%(Easy), 25.18%(Moderate), 21.90%(Hard)로, 최첨단 성능을 달성함을 확인하였다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Computer visionComputer scienceArtificial intelligenceMonocularComputer graphics (images)
타입
Article
IF / 인용수
2.5 / 3
게재 연도
2025