Anytime 3D Object Reconstruction Using Multi-Modal Variational Autoencoder | 유현우 교수 연구실 | 성균관대학교 지능형로봇학과

유현우 교수 연구실

홈

기본 정보

연구 분야

프로젝트

논문

구성원

article|

인용수 8

·2022

Anytime 3D Object Reconstruction Using Multi-Modal Variational Autoencoder

Hyeonwoo Yu, Jean Oh

IF 5.2 (2022) IEEE Robotics and Automation Letters

초록

인간-로봇 팀 협력을 효과적으로 수행하기 위해서는 로봇이 자신의 시각 인식을 인간 운영자와 공유할 수 있어야 한다. 열악한 원격 협업 환경에서는 오토인코더와 같은 데이터 압축 기법을 활용하여 잠재 변수(latent variables) 형태로 데이터를 획득하고, 이를 컴팩트한 형태로 전송할 수 있다. 또한 환경이 불안정하더라도 실시간 런타임 성능을 보장하기 위해, 불완전한 정보로부터 전체 내용을 복원할 수 있는(anytime) 추정 접근이 요구된다. 이러한 맥락에서, 일부 요소가 손실된 잠재 변수의 결측(imputation)을 위한 방법을 제안한다. 단지 몇 차원의 변수만을 사용하면서도 언제든지(anytime) 특성을 달성하기 위해서는 범주 수준(category-level)의 사전 정보(prior information)를 활용하는 것이 필수적이다. 변분 오토인코더(variational autoencoders)에서 사용하는 사전 분포는 훈련 데이터 각 샘플의 라벨과 무관하게 등방성 가우시안(isotropic Gaussian)으로 단순 가정된다. 이러한 형태의 평탄화된 사전 분포는 범주 수준의 분포로부터 결측 보간을 수행하기 어렵게 만든다. 본 연구는 잠재 공간(latent space)에서 범주 특화(category-specific) 다중모달(multi-modal) 사전 분포를 활용함으로써 이 한계를 극복한다. 부분적으로 전송된 데이터의 결측 요소는, 남아 있는 요소에 따라 특정 모달(modal)을 찾아 샘플링하여 복원할 수 있다. 제안된 방법은 부분 요소를 사용하여 언제든지 추정(anytime estimation)을 수행하도록 설계되었으므로, 데이터에 대한 과도한 압축(over-compression)에도 적용할 수 있다. ModelNet 및 Pascal3D 데이터셋에 대한 실험 결과, 본 접근법은 데이터 손실이 최대 70%까지 오토인코더 및 변분 오토인코더보다 일관되게 우수한 성능을 보였다. 소프트웨어는 오픈 소스이며, 우리의 저장소 ¹에서 제공된다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

AutoencoderComputer scienceArtificial intelligenceModalRobotLatent variableImputation (statistics)GaussianProperty (philosophy)Pattern recognition (psychology)

타입

article

IF / 인용수

5.2 / 8

원문

https://doi.org/10.1109/lra.2022.3142439

게재 연도

2022

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)