물류 자동화에서 가려진(미관측) 물체에 대한 정밀한 분할은 복잡한 환경에서 효율적인 로봇 조작을 위해 핵심적이다. 빈 픽킹(bin-picking) 및 선반 픽킹(shelfpicking)과 같은 작업은 가림(occlusions), 다양한 물체 형태, 복잡한 공간 배치에 대응하기 위한 견고한 지각을 요구한다. 전통적인 RGB 기반 방법은 텍스처에 의존하기 때문에 물체를 과분할하는 경향이 있는 반면, 깊이 기반 방법은 주로 기하학적 특징에 초점을 맞추는 탓에 물체를 과소분할하는 경우가 잦다. 이러한 한계를 해결하기 위해, 우리는 가변(deformable) 주의(attention) 기반 RGB-D 융합 트랜스포머인 DA-Fusion을 제안하며, 이는 미관측 물체 인스턴스 분할을 위한 모델이다. DA-Fusion은 RGB와 깊이 데이터의 장점을 효과적으로 결합하여, 복잡하고 다층으로 구성된 물체 환경에서 분할 정확도를 향상시킨다. 또한 우리는 상면(top-down) 시점을 기준으로 한 빈 픽킹 시나리오 평가에 특화된 벤치마크 데이터셋인 Object Clutter Bin Dataset(OCBD)을 도입한다. 광범위한 평가는 DA-Fusion이 다양한 환경 전반에서 기존의 최신 방법들보다 우수함을 보여주며, 이를 통해 실제 물류 작업에 특히 적합함을 입증한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.