주요 논문
3
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
article
|
·
인용수 0
·
2025Robust Task Planning via Failure Detection Using Scene Graph From Multi-View Images
Haechan Chong, Jongwon Lee, Hyemin Ahn
IEEE Robotics and Automation Letters
최근의 로봇 작업 계획자들은 실패 탐지(failure detector)로서 대규모 언어 모델(LLMs) 또는 비전-언어 모델(VLMs)을 활용한다. 이러한 방법들은 의미적 추론 능력을 활용함으로써 성능을 잘 발휘하지만, 대체로 환경을 충분히 이해하고 있다는 가정을 전제로 하여, 명시적인 구조적 모델링이 없는 복잡한 장면에서는 신뢰할 수 없는 계획으로 이어질 수 있다. 이러한 한계를 해결하기 위해, 본 연구는 객체 수준의 관계를 명시적으로 모델링하는 새로운 다중 뷰 장면 이해 프레임워크를 제안하며, 이를 통해 실패 탐지와 효과적인 작업 재계획을 가능하게 한다. 우리의 접근은 먼저 포괄적인 커버리지를 위해 다중 뷰 이미지를 획득하고, 객체 정체성과 관계 정보를 인코딩하는 로컬 2D 장면 그래프를 생성한다. 이를 바탕으로, 로컬 2D 장면 그래프들을 하나의 통합 표현으로 결합하는 그래프 신경망 기반 모델을 도입한다. 이 과정은 통합 장면 그래프를 생성하며, 이를 사용하여 작업 성공 여부를 판별하고 실패 원인을 식별한다. 각 하위 작업에 대해, 본 프레임워크는 작업 계획 단계에서 LLM이 예측한 기대 장면 그래프와 통합 장면 그래프를 비교하고, 두 그래프 간의 일탈(deviations)에 근거하여 잠재적 실패 원인을 식별한다. 이후 이러한 원인들을 LLM에 다시 입력하여 효과적인 재계획을 돕고, 반복적 실패를 줄이며 적응성을 향상시킨다. 우리는 다섯 개의 실제 환경 기반 벤치마크 작업에서 본 프레임워크의 적용 가능성을 입증한다. 또한 실패 탐지 및 추론 성능을 다른 방법들과 별도로 비교하여, 다중 뷰 인식과 명시적 그래프 기반 추론을 결합할 때의 이점을 보여준다. 추가 정보는 https://sites.google.com/view/scrutinize-robot-manipulation에서 확인할 수 있다.
https://doi.org/10.1109/lra.2025.3645659
Scene graph
Task (project management)
Graph
Robot
Object detection
Process (computing)
Benchmark (surveying)
Task analysis
2
article
|
·
인용수 1
·
2025Tidiness Score-Guided Monte Carlo Tree Search for Visual Tabletop Rearrangement
Hogun Kee, Wooseok Oh, Minjae Kang, Hyemin Ahn, Songhwai Oh
IEEE Robotics and Automation Letters
본 논문에서는 RGB-D 카메라만을 사용하여 탁상 정리(tabletop tidying up) 문제를 해결하도록 설계된 새로운 프레임워크인 정리도(tidiness score) 기반 몬테카를로 트리 탐색(TSMCTS; tidiness score-guided Monte Carlo tree search)을 제시한다. 우리는 탁상 정리 문제에 대한 두 가지 주요 문제를 다룬다: (1) 공개 데이터셋 및 벤치마크의 부재, 그리고 (2) 보지 못한 물체들의 목표 구성(goal configuration)을 명시하는 데 따르는 어려움이다. 전자의 문제를 해결하기 위해 시뮬레이션에서 수집된 구조화된 데이터셋인 탁상 정리(TTU; tabletop tidying up) 데이터셋을 제시한다. 이 데이터셋을 사용하여 정리도를 예측할 수 있는 비전 기반 판별기(discriminator)를 학습한다. 이 판별기는 실제 환경 장면을 포함하여, 보지 못한 구성 전반에 걸쳐 정리도의 정도를 일관되게 평가할 수 있다. 두 번째 문제를 해결하기 위해, 명시적 목표를 지정하지 않고도 정리 궤적(tidying trajectories)을 찾기 위해 몬테카를로 트리 탐색(MCTS; Monte Carlo tree search)을 사용한다. 구체적인 목표를 제공하는 대신, 정리도 점수를 지침(guidance)으로 활용하는 MCTS 기반 계획(planner)이 다양한 정리된 구성을 찾을 수 있음을 보여준다. 그 결과, 정리도 판별기와 MCTS 기반 정리 계획기를 통합하여 최적의 정리된 배치를 찾는 TSMCTS를 제안한다. TSMCTS는 커피 테이블, 식탁, 사무용 책상, 욕실을 포함한 다양한 환경에서 그 수행 능력을 성공적으로 입증하였다. TTU 데이터셋은 다음에서 제공된다: https://github.com/rllab-snu/TTU-Dataset.
https://doi.org/10.1109/lra.2025.3597822
Monte Carlo method
Tree (set theory)
Computer science
Monte Carlo tree search
Artificial intelligence
Mathematics
Statistics
Combinatorics
3
article
|
인용수 9
·
2023Vision-Based Approximate Estimation of Muscle Activation Patterns for Tele-Impedance
Hyemin Ahn, Youssef Michel, Thomas Eiband, Dongheui Lee
IF 4.6 (2023)
IEEE Robotics and Automation Letters
주어진 과제를 성공적으로 수행하기 위해 근육의 힘을 적절히 조절하는 것은 인간의 본성에 해당한다. 이러한 제어 능력을 로봇으로 이전하는 문제는 연구자들 사이에서 큰 관심사였으나, 시각적 관찰만을 바탕으로 로봇이 임피던스 제어를 학습하도록 만드는 시도는 이루어지지 않았다. 오히려 원격 임피던스(tele-impedance) 연구는 일반적으로 EMG 센서와 같은 특수 장치에 의존해 왔는데, 이는 접근성이 낮고 단순 RGB 웹캠에 비해 일반화 능력도 떨어진다. 본 서신에서는 제안된 대략적 추정 근활성(muscle activation) 패턴에 기반한, 비전 기반 로봇 원격 임피던스 제어 시스템을 제안한다. 이러한 패턴은 입력으로서 저렴한 상용 웹캠의 RGB 이미지를 사용하는 제안된 딥러닝 기반 모델로부터 얻어진다. 특히, 우리의 모델은 사람들이 근육에 어떤 가시적 표식을 부착할 필요가 없다는 점이 주목할 만하다. 실험 결과에 따르면, 우리의 모델은 로봇이 특정 과제를 성공적으로 수행하기 위해 인간이 근육 힘을 어떻게 조절하는지를 모방할 수 있게 해준다. 비록 우리의 실험은 원격 임피던스 제어에 초점을 맞추고 있으나, 본 시스템은 또한 성공적인 과제 수행을 위해 가변 강성 제어(variable stiffness control)의 정보를 통합하는, 시연으로부터의 비전 기반 학습을 개선하기 위한 기초(baseline)를 제공할 수 있다.
https://doi.org/10.1109/lra.2023.3293275
Robot
Computer science
Artificial intelligence
Task (project management)
Generalization
RGB color model
Computer vision
Electrical impedance
Impedance control
Deep learning