안혜민 교수 연구실 | EE

머신러닝, 인간-로봇-상호작용 연구실

EE 안혜민 교수

안혜민 교수 연구실

홈

기본 정보

연구 분야

프로젝트

논문

구성원

홈

머신러닝, 인간-로봇-상호작용 연구실

EE 안혜민 교수

울산과학기술원의 머신러닝, 인간-로봇-상호작용 연구실입니다.

대표 연구 분야

연구 영역 전체보기

Diffusion 기반 로봇·인간 모션 예측 및 생성

Diffusion-Based Motion Prediction and Generation for Robots and Humans

연구 분야 상세보기

Diffusion 기반 로봇·인간 모션 예측 및 생성

Diffusion-Based Motion Prediction and Generation for Robots and Humans

연구 분야 상세보기

영상 기반 텔레-임피던스 제어를 위한 근활성 추정

Vision-Based Tele-Impedance Control via Muscle Activation Estimation

연구 분야 상세보기

LLM 기반 인간-로봇 상호작용: 음성 이해, 계획, 실패 감지

LLM-Based Human-Robot Interaction: Voice Understanding, Task Planning, and Failure Detection

연구 분야 상세보기

연구 성과 추이

표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.

5개년 연도별 논문 게재 수

24총합

5개년 연도별 피인용 수

199총합

주요 논문

논문 전체보기

article

인용수 0

2025

Robust Task Planning via Failure Detection Using Scene Graph From Multi-View Images

Haechan Chong, Jongwon Lee, Hyemin Ahn

IEEE Robotics and Automation Letters

최근의 로봇 작업 계획자들은 실패 탐지(failure detector)로서 대규모 언어 모델(LLMs) 또는 비전-언어 모델(VLMs)을 활용한다. 이러한 방법들은 의미적 추론 능력을 활용함으로써 성능을 잘 발휘하지만, 대체로 환경을 충분히 이해하고 있다는 가정을 전제로 하여, 명시적인 구조적 모델링이 없는 복잡한 장면에서는 신뢰할 수 없는 계획으로 이어질 수 있다. 이러한 한계를 해결하기 위해, 본 연구는 객체 수준의 관계를 명시적으로 모델링하는 새로운 다중 뷰 장면 이해 프레임워크를 제안하며, 이를 통해 실패 탐지와 효과적인 작업 재계획을 가능하게 한다. 우리의 접근은 먼저 포괄적인 커버리지를 위해 다중 뷰 이미지를 획득하고, 객체 정체성과 관계 정보를 인코딩하는 로컬 2D 장면 그래프를 생성한다. 이를 바탕으로, 로컬 2D 장면 그래프들을 하나의 통합 표현으로 결합하는 그래프 신경망 기반 모델을 도입한다. 이 과정은 통합 장면 그래프를 생성하며, 이를 사용하여 작업 성공 여부를 판별하고 실패 원인을 식별한다. 각 하위 작업에 대해, 본 프레임워크는 작업 계획 단계에서 LLM이 예측한 기대 장면 그래프와 통합 장면 그래프를 비교하고, 두 그래프 간의 일탈(deviations)에 근거하여 잠재적 실패 원인을 식별한다. 이후 이러한 원인들을 LLM에 다시 입력하여 효과적인 재계획을 돕고, 반복적 실패를 줄이며 적응성을 향상시킨다. 우리는 다섯 개의 실제 환경 기반 벤치마크 작업에서 본 프레임워크의 적용 가능성을 입증한다. 또한 실패 탐지 및 추론 성능을 다른 방법들과 별도로 비교하여, 다중 뷰 인식과 명시적 그래프 기반 추론을 결합할 때의 이점을 보여준다. 추가 정보는 https://sites.google.com/view/scrutinize-robot-manipulation에서 확인할 수 있다.

https://doi.org/10.1109/lra.2025.3645659

Scene graph

Task (project management)

Graph

Robot

Object detection

Process (computing)

Benchmark (surveying)

Task analysis

article

인용수 1

2025

Tidiness Score-Guided Monte Carlo Tree Search for Visual Tabletop Rearrangement

Hogun Kee, Wooseok Oh, Minjae Kang, Hyemin Ahn, Songhwai Oh

IEEE Robotics and Automation Letters

본 논문에서는 RGB-D 카메라만을 사용하여 탁상 정리(tabletop tidying up) 문제를 해결하도록 설계된 새로운 프레임워크인 정리도(tidiness score) 기반 몬테카를로 트리 탐색(TSMCTS; tidiness score-guided Monte Carlo tree search)을 제시한다. 우리는 탁상 정리 문제에 대한 두 가지 주요 문제를 다룬다: (1) 공개 데이터셋 및 벤치마크의 부재, 그리고 (2) 보지 못한 물체들의 목표 구성(goal configuration)을 명시하는 데 따르는 어려움이다. 전자의 문제를 해결하기 위해 시뮬레이션에서 수집된 구조화된 데이터셋인 탁상 정리(TTU; tabletop tidying up) 데이터셋을 제시한다. 이 데이터셋을 사용하여 정리도를 예측할 수 있는 비전 기반 판별기(discriminator)를 학습한다. 이 판별기는 실제 환경 장면을 포함하여, 보지 못한 구성 전반에 걸쳐 정리도의 정도를 일관되게 평가할 수 있다. 두 번째 문제를 해결하기 위해, 명시적 목표를 지정하지 않고도 정리 궤적(tidying trajectories)을 찾기 위해 몬테카를로 트리 탐색(MCTS; Monte Carlo tree search)을 사용한다. 구체적인 목표를 제공하는 대신, 정리도 점수를 지침(guidance)으로 활용하는 MCTS 기반 계획(planner)이 다양한 정리된 구성을 찾을 수 있음을 보여준다. 그 결과, 정리도 판별기와 MCTS 기반 정리 계획기를 통합하여 최적의 정리된 배치를 찾는 TSMCTS를 제안한다. TSMCTS는 커피 테이블, 식탁, 사무용 책상, 욕실을 포함한 다양한 환경에서 그 수행 능력을 성공적으로 입증하였다. TTU 데이터셋은 다음에서 제공된다: https://github.com/rllab-snu/TTU-Dataset.

https://doi.org/10.1109/lra.2025.3597822

Monte Carlo method

Tree (set theory)

Computer science

Monte Carlo tree search

Artificial intelligence

Mathematics

Statistics

Combinatorics

article

인용수 9

2023

Vision-Based Approximate Estimation of Muscle Activation Patterns for Tele-Impedance

Hyemin Ahn, Youssef Michel, Thomas Eiband, Dongheui Lee

IF 4.6 (2023)

IEEE Robotics and Automation Letters

주어진 과제를 성공적으로 수행하기 위해 근육의 힘을 적절히 조절하는 것은 인간의 본성에 해당한다. 이러한 제어 능력을 로봇으로 이전하는 문제는 연구자들 사이에서 큰 관심사였으나, 시각적 관찰만을 바탕으로 로봇이 임피던스 제어를 학습하도록 만드는 시도는 이루어지지 않았다. 오히려 원격 임피던스(tele-impedance) 연구는 일반적으로 EMG 센서와 같은 특수 장치에 의존해 왔는데, 이는 접근성이 낮고 단순 RGB 웹캠에 비해 일반화 능력도 떨어진다. 본 서신에서는 제안된 대략적 추정 근활성(muscle activation) 패턴에 기반한, 비전 기반 로봇 원격 임피던스 제어 시스템을 제안한다. 이러한 패턴은 입력으로서 저렴한 상용 웹캠의 RGB 이미지를 사용하는 제안된 딥러닝 기반 모델로부터 얻어진다. 특히, 우리의 모델은 사람들이 근육에 어떤 가시적 표식을 부착할 필요가 없다는 점이 주목할 만하다. 실험 결과에 따르면, 우리의 모델은 로봇이 특정 과제를 성공적으로 수행하기 위해 인간이 근육 힘을 어떻게 조절하는지를 모방할 수 있게 해준다. 비록 우리의 실험은 원격 임피던스 제어에 초점을 맞추고 있으나, 본 시스템은 또한 성공적인 과제 수행을 위해 가변 강성 제어(variable stiffness control)의 정보를 통합하는, 시연으로부터의 비전 기반 학습을 개선하기 위한 기초(baseline)를 제공할 수 있다.

https://doi.org/10.1109/lra.2023.3293275

Robot

Computer science

Artificial intelligence

Task (project management)

Generalization

RGB color model

Computer vision

Electrical impedance

Impedance control

Deep learning

최신 정부 과제

과제 전체보기

주관|

2023년 9월-2024년 9월

|20,000,000원

완성도 높은 모션 계획 및 생성이 가능한 가정용 로봇 개발

1. 거주 환경에 적합한 로봇 하드웨어 프로토타입 디자인 - 본 과제에선 거주 환경에서 효과적으로 활용 가능한 로봇 하드웨어 프로토타입을 디자인하고자 하며, 자유롭게 Plug-and-Play가 가능한 6자유도 로봇 팔 하드웨어를 고려하고 있음. - 또한, 다양한 형태의 모바일 매니퓰레이터를 활용해 로봇의 다용도성을 높이고자 하며, 이 때 안전성과 사용자 친화성을 고려할 수 있도록 할 예정임. 2. 복잡한 과제를 해결하기 위한 로봇 모션 계획 기술 개발 - 인간이 거주 환경 내에서 풀어야하는 다양한 과제들은 주어진 목적 및 의도 달성을 위한 장기간 행동 계획을 필요로 하며, 본 과제에서는 이를 위한 요소 기술들을 개발하고자 함. - 해당 요소 기술은 주어진 목적 및 의도들을 달성하기 위해 인간이 어떤 순서대로 하위 행동들을 수행하는지를 다량의 비디오를 통해 계층적으로 분석할 예정임. - 비디오에서 얻어진 정보들은 인간이 수행할 수 있는 다양한 과제에 대한 representation으로 인코딩 되며, 인코딩 된 정보는 로봇이 수행해야하는 하위 행동들의 장기간 시퀀스로 디코딩 될 예정임. 3. 상황 및 문맥 정보들을 고려한 로봇 모션 생성 기술 개발 - 인간과 공존하는 로봇은 상황 및 문맥 정보들을 파악하여 적절한 모션을 수행할 필요가 있음. - 이를 위해 본 과제에선 이미지/비디오를 언어로 설명해주는 video/image-to-text 모델을 활용해, 로봇 카메라로 습득한 주변 환경 관측 이미지/비디오를 언어 문장으로 설명해줌으로서 로봇이 어떤 상황에 놓여있는지 파악하게 도와줄 예정임. - 로봇이 현재 어떤 상황에 놓여있는지 설명하는 언어 문장을 얻어내면, 이후 상식/지식을 습득한 거대 언어 모델을 활용해 로봇이 어떤 행동을 하면 좋을지에 대한 답안을 얻어낼 예정임. - 예를 들어 “아이가 잠을 자고 있다. 로봇이 무엇을 하면 좋을까?” 라고 거대 언어 모델에게 물었을 때, “로봇은 아이를 방해하지 않도록 조용히 지나가야 합니다.” 라는 대답이 얻어졌을 경우, 이를 참고해 로봇의 이동 경로 및 속도를 계획한다면 주변 상황 및 문맥을 고려한 모션 생성이 가능하게 될 것임. 4. 인간 중심적 및 친화적 로봇 모션 계획 및 생성 기술 개발 - 인간과 공존하는 로봇은 인간이 지키는 사회적 규범들을 이해해야하며, 이를 최대한 따르기 위한 행동들을 계획 및 생성함으로서 인간 중심적 및 친화적 로봇이 되어야 함. 예를 들어 사람이 부엌에서 거실로 이동해 가는 경우, 로봇은 그 앞을 가로질러 막지 않도록 자신의 이동 경로를 계획할 필요가 있음. - 이를 위해 본 과제에선 로봇이 가정환경에서 어떤 행동을 하는 것이 사회적으로 옳고 그른지 알려줄 수 있는 시뮬레이터를 만들어낼 예정임. - 해당 시뮬레이터는 주어진 거주 환경 내에서 하루 일과를 수행해내는 사람을 모델링 한 뒤, 해당 사람이 로봇과 마주하게 될 경우 어떤 긍정적/부정적 반응을 보일 것 인지 또한 모델링할 예정임. - 이러한 인간 행동 모델링을 위해선 사전에 정의된 정교한 규칙들에 기반할 수도 있지만, 본 과제에선 이를 인간에 대한 상식을 사전에 습득한 거대 언어 모델에 기반해 시도해볼 예정임. - 로봇은 제안하는 시뮬레이터 속에서 다양한 방식 (예: 지도학습, 강화학습) 으로 가상의 인간들과 상호작용해보며 어떤 모션이 인간 중심적 및 친화적이라고 불릴 수 있는지 학습할 수 있게 될 것임.

로봇

로봇 행동 계획

로봇 모션 생성

주관|

2023년 3월-2027년 12월

|1,252,653,000원

심혈관질환 진단 및 예측을 위한 체내 삽입형 인공지능 융복합 센서 모듈기술 개발

본 과제는 심혈관질환을 더 일찍 알아내기 위해, 몸 안에 넣어 쓸 수 있는 융복합 센서 모듈과 인공지능 기반 실시간 분석 시스템을 개발하는 연구임. 연구목표는 체내삽입형 혈당 센서 규격 설계, 다중 생체신호분석 SoC, 무선 통신 통합모듈, FPGA targeting & validation 플랫폼, 인공지능 디지털 가속 엔진(MDSP) 알고리즘, 혈압 센서 규격 및 생체적합성 패키징, 심혈관질환 예측 인공지능 규격, 융복합 센서 모듈 체내이식방법을 통합하는 데 있음. 기대효과는 저전력·소형화·무선화·지능화 기반 의료기기 구현, Fringing field 혈당센서 및 MEMS 기반 LC공진형 압력센서의 고도화된 예측·진단으로 바이오 생체신호 예측 전반 확장, 이식형 장비 표준화와 원격의료 서비스 촉진임.

혈당

혈압

인공지능

센서융합

시스템반도체

2023년 3월-2027년 12월

|1,728,414,000원

심혈관질환 진단 및 예측을 위한 체내 삽입형 인공지능 융복합 센서 모듈기술 개발

심혈관질환의 진단 및 예측을 위한 체내삽입형 융복합 센서 모듈 및 인공지능 기반 실시간 모니터링/진단이 가능한 복합센싱 데이터 분석 시스템 개발

혈당

혈압

인공지능

센서융합

시스템반도체

연구실 하이라이트

연구실의 정보를 AI가 요약해서 키워드 중심으로 정리해두었어요

독창적기술

차세대 원격 로봇 제어: 시각 기반 근활성도 예측 기술

AI 요약 확인하기

기술파급력

사람처럼 묻고 이해하는 로봇: 대화형 자연어 기반 상호작용 기술

AI 요약 확인하기

SCIE논문

시선을 읽어 행동을 예측하는 AI: 인간-객체 상호작용 예측 기술

AI 요약 확인하기

상용화성공

음악을 3D 댄스로 창조하는 AI: 생성형 춤 동작 합성 기술

AI 요약 확인하기

핵심기반기술

로봇의 '눈'을 완성하다: 고정밀 6D 객체 자세 추정 기술

AI 요약 확인하기

연구자역량

사용자의 '개인 공간'을 존중하는 로봇: 개인화된 접근 학습 기술

AI 요약 확인하기

맞춤형 인사이트 리포트

연구실의 전체 데이터를 활용한 맞춤형 인사이트 리포트

연구 트렌드부터 공동 연구 방향성 기획까지

연구실과 같이 할 수 있는게 무엇인지,
지금 바로 확인해보세요

무료 리포트 확인하기

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)