Memory-driven deep-reinforcement learning for autonomous robot navigation in partially observable environments | 미트라게게르치 교수 연구실 | 성균관대학교 전자전기컴퓨터공학과

미트라게게르치 교수 연구실

서비스 플랜

연구실 검색

프로젝트 공고

정부 과제 추천

AI 기반 기업 서칭

홈

기본 정보

연구 분야

프로젝트

논문

구성원

article|

인용수 4

·2025

Memory-driven deep-reinforcement learning for autonomous robot navigation in partially observable environments

Estrella Montero, Nabih Pico, Mitra Ghergherehchi, Ho Seung Song

IF 5.4Engineering Science and Technology an International Journal

초록

자율적 항법 능력을 갖춘 서비스 로봇은 안전하고 충돌이 없는 인간 상호작용이 중요한 동적 환경에서 핵심적인 역할을 한다. 그러나 인간 행동의 예측 불가능성, 폐색(occlusion)의 빈번함, 그리고 센서 한계로 인한 완전한 환경 인식의 부재는 효과적인 로봇 항법을 크게 제약할 수 있다. 본 연구에서는 부분 관측 환경에서 충돌이 없는 사전적(proactive) 항법을 가능하게 하기 위해 심층 강화학습을 사용하는 기억 기반 알고리즘을 제안한다. 제안 방법은 제한된 FoV(시야)와 센서 범위 내에서 인간의 상대적 상태를 신경망의 입력으로 활용한다. 이 모델은 시간 함수로 양방향 게이티드 순환 회로 유닛(bidirectional gated recurrent unit)을 사용하여 입력 시퀀스의 이전 맥락을 전략적으로 반영하고 관측 내용을 동화(assimilation)하는 데 도움을 준다. 이러한 접근은 모델이 복잡한 인간–로봇 관계에 더 큰 주의를 부여하도록 하여, 환경 내에서 끊임없이 변화하는 역학을 더 잘 이해할 수 있게 한다. 시뮬레이션과 실험 결과는 정책 기반 항법 접근의 효능을 검증한다. 또한 기존의 대표적 방법들에 비해 우수한 충돌 회피 성능을 달성하며, 학습 과정에서 센서의 제한을 통합함으로써 효율적인 항법을 보인다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Reinforcement learningObservableRobotReinforcementArtificial intelligenceComputer scienceAutonomous robotAutonomous learningMobile robotHuman–computer interaction

타입

article

IF / 인용수

5.4 / 4

원문

https://doi.org/10.1016/j.jestch.2024.101942

게재 연도

2025

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)