Collision-free robot navigation in confined and partially observable environments using spatial-memory deep reinforcement learning | 미트라게게르치 교수 연구실 | 성균관대학교 전자전기컴퓨터공학과

미트라게게르치 교수 연구실

서비스 플랜

연구실 검색

프로젝트 공고

정부 과제 추천

AI 기반 기업 서칭

홈

기본 정보

연구 분야

프로젝트

논문

구성원

article|

인용수 1

·2025

Collision-free robot navigation in confined and partially observable environments using spatial-memory deep reinforcement learning

Estrella Montero, Nabih Pico, Mitra Ghergherehchi, Hyojeong Choi

IF 5.9Ain Shams Engineering Journal

초록

인간 중심 환경에서 운용되는 자율 로봇에 있어 견고한 내비게이션은 매우 중요하지만, 센서의 한계, 환경적 제약, 예측 불가능한 인간의 이동은 부분 관측 하에서의 계획을 어렵게 만든다. 본 연구는 로봇-군중 상호작용의 비선형 동역학을 다루기 위해 공간-시간 인코딩 방식을 활용하는 심층 강화학습 기반 알고리즘을 제안한다. 여기서 작은 움직임 변화가 로봇의 운동에 중대한 영향을 미칠 수 있다. 이 모델은 로봇의 360∘ 센싱 범위 내 인간들의 상대 위치를 처리하고, 과거 관측을 유지하기 위해 양방향 게이트 순환 신경망 단위(bidirectional gated recurrent units)로 구성된 공간-시간 모듈을 통합한다. 주의(attention) 메커니즘은 인간-로봇 상호작용을 동적으로 우선순위화하며, 공간 메모리 내의 전역 계획 모듈은 제한된 공간에서 반응적이면서도 전역적으로 안전한 경로 계획을 모두 보장한다. 보상 함수는 벽과의 충돌이나 정지(freezing)와 같은 안전하지 않은 행동을 벌칙하고, 매끄럽고 충돌이 없는 진행을 유도한다. 시뮬레이션과 실제 환경 실험 모두에서 검증된 본 방법은 공간-메모리 주의와 보상 설계를 통해 로봇-군중 상호작용의 비선형 동역학을 모델링하는 데 효과가 있음을 보여주며, 안전하고 적응적인 내비게이션을 달성한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

ObservabilityReinforcement learningMotion planningRobotEncoding (memory)Nonlinear systemPath (computing)Range (aeronautics)

타입

article

IF / 인용수

5.9 / 1

원문

https://doi.org/10.1016/j.asej.2025.103867

게재 연도

2025

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)