임성훈 교수 연구실
기본 정보
연구 분야
프로젝트
논문
구성원
article|
·
인용수 0
·2026
CascadeOcc: Rethinking 3D Occupancy World Models With Cascaded VQ Representations
Kyumin Hwang, Wonhyeok Choi, Jae-Yeul Kim, Ji‐Hun Park, Dae-Hee Park, Sunghoon Im
IF 3.9 (2026) IEEE Signal Processing Letters
초록

이 편지는 자율주행을 위해 외재적 보조 양식보다 본질적인 구조적 계층성을 우선하는 새로운 점유(occupancy) 월드 모델인 CascadeOcc를 제안한다. 점유 월드 모델—미래의 주행 환경을 예측하고 주행 궤적을 계획하는—은 지각과 계획을 효과적으로 연결하지만, 현재의 접근들은 종종 외부 양식이나 대규모 언어 모델에 크게 의존하여 점유 표현 그 자체가 지니는 내재적 구조적 잠재력을 충분히 활용하지 못하는 경우가 많다. 복잡한 3D 장면에 대한 표현 능력을 향상시키기 위해, 우리는 자기회귀 프레임워크에 계단식 Vector Quantized (VQ) 메커니즘을 통합한다. 거친 것에서 정교한 것으로(coarse-to-fine)이라는 원리에 따라, CascadeOcc는 다중 스케일 아키텍처를 통해 전역 구조로부터 미세한 디테일을 점진적으로 정교화한다. 또한, 다중 스케일 시간적 의존성을 포착하기 위해 TimeMixer를 도입하여 공간과 시간 모두에서 이중 계층(dual-hierarchy) 메커니즘을 구축한다. 4D 점유 예측 및 모션 계획 벤치마크에 대한 실험 결과는 CascadeOcc가 비전 중심 접근들 가운데서도 우수한 성능을 달성함을 보여주며, 내재적 표현을 최적화하는 것이 외부 파운데이션 모델에 의존하는 것에 대한 강력한 대안임을 검증한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Pattern recognition (psychology)Representation (politics)Probabilistic logicOccupancySignal processingObject (grammar)
타입
article
IF / 인용수
3.9 / 0
게재 연도
2026

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.