자율적 항법 능력을 갖춘 서비스 로봇은 안전하고 충돌이 없는 인간 상호작용이 중요한 동적 환경에서 핵심적인 역할을 한다. 그러나 인간 행동의 예측 불가능성, 폐색(occlusion)의 빈번함, 그리고 센서 한계로 인한 완전한 환경 인식의 부재는 효과적인 로봇 항법을 크게 제약할 수 있다. 본 연구에서는 부분 관측 환경에서 충돌이 없는 사전적(proactive) 항법을 가능하게 하기 위해 심층 강화학습을 사용하는 기억 기반 알고리즘을 제안한다. 제안 방법은 제한된 FoV(시야)와 센서 범위 내에서 인간의 상대적 상태를 신경망의 입력으로 활용한다. 이 모델은 시간 함수로 양방향 게이티드 순환 회로 유닛(bidirectional gated recurrent unit)을 사용하여 입력 시퀀스의 이전 맥락을 전략적으로 반영하고 관측 내용을 동화(assimilation)하는 데 도움을 준다. 이러한 접근은 모델이 복잡한 인간–로봇 관계에 더 큰 주의를 부여하도록 하여, 환경 내에서 끊임없이 변화하는 역학을 더 잘 이해할 수 있게 한다. 시뮬레이션과 실험 결과는 정책 기반 항법 접근의 효능을 검증한다. 또한 기존의 대표적 방법들에 비해 우수한 충돌 회피 성능을 달성하며, 학습 과정에서 센서의 제한을 통합함으로써 효율적인 항법을 보인다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.