Vision-Based Robot Perception: CNN/Transformer Pose and Detection Estimation
연구 내용
수중·산업·서비스 환경에서 로봇이 필요로 하는 검출과 6-DoF 포즈 추정을 위해 CNN 인코더와 Transformer 기반 모델을 설계하는 연구
로봇이 실제 환경에서 수행해야 하는 검출과 조작용 포즈 추정은 조명 변화, 질감 부재, 시각적 잡음에 의해 성능이 흔들리기 쉽습니다. 이에 따라 수중 글라이더 탐지를 위해 CNN 비전 인코더를 경량화하고, 이미지 분할 패치와 global max-pooling으로 특징의 공간적 보존과 추론 효율을 동시에 고려합니다. 또한 파이프 내부 스패터를 카메라 기반 이미지 인식으로 위치와 크기를 추정하여 연삭 모듈의 작업 범위를 결정하는 구조를 제안합니다. 포즈 추정 영역에서는 Transformer 모델을 데이터 효율과 다중 객체 추론 관점에서 개선하고, 텍스처리스 물체에 대해 깊이 기반 기하 특징만으로 6-DoF 포즈를 추정하는 모델-프리 프레임을 구성합니다.
관련 연구 성과
관련 논문
4편
관련 특허
0건
관련 프로젝트
3건
연구 흐름
2022년에는 산업 공정에서 카메라 이미지를 기반으로 결함 위치를 찾고 작업 동작을 연결하는 로봇 시스템을 다루며 시각 검출 파이프라인을 구축했습니다. 2024년에는 수중 환경에서 글라이더를 자동으로 탐지하기 위해 경량 CNN 인코더와 특징 집계 방식을 설계하여 실환경 추론을 강화했습니다. 2025년에는 포즈 추정에서 Transformer 구조의 메모리 부담과 학습 효율 문제를 줄이기 위한 모델 개선을 수행했고, 텍스처리스 테이블웨어에 대해서는 깊이 기하 특징과 그리드 기반 표현을 사용해 6-DoF를 직접 예측하는 프레임워크로 확장했습니다. 이러한 흐름은 검출에서 포즈 추정으로, 그리고 특정 CAD 의존성 없이 기하 기반으로 확장되는 방향을 형성합니다.
활용 가능성
활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.
관련 논문
구분
제목
Artificial Neural Network for Glider Detection in a Marine Environment by Improving a CNN Vision Encoder
Pipe Spatter Detection and Grinding Robot
A Study on Systematic Improvement of Transformer Models for Object Pose Estimation
Model-Free Transformer Framework for 6-DoF Pose Estimation of Textureless Tableware Objects
관련 프로젝트
구분
제목
수산식품 스마트 가공 기술개발
수산식품 스마트 가공 기술개발
수산식품 스마트 가공 기술개발