인간 중심 환경에서 운용되는 자율 로봇에 있어 견고한 내비게이션은 매우 중요하지만, 센서의 한계, 환경적 제약, 예측 불가능한 인간의 이동은 부분 관측 하에서의 계획을 어렵게 만든다. 본 연구는 로봇-군중 상호작용의 비선형 동역학을 다루기 위해 공간-시간 인코딩 방식을 활용하는 심층 강화학습 기반 알고리즘을 제안한다. 여기서 작은 움직임 변화가 로봇의 운동에 중대한 영향을 미칠 수 있다. 이 모델은 로봇의 360∘ 센싱 범위 내 인간들의 상대 위치를 처리하고, 과거 관측을 유지하기 위해 양방향 게이트 순환 신경망 단위(bidirectional gated recurrent units)로 구성된 공간-시간 모듈을 통합한다. 주의(attention) 메커니즘은 인간-로봇 상호작용을 동적으로 우선순위화하며, 공간 메모리 내의 전역 계획 모듈은 제한된 공간에서 반응적이면서도 전역적으로 안전한 경로 계획을 모두 보장한다. 보상 함수는 벽과의 충돌이나 정지(freezing)와 같은 안전하지 않은 행동을 벌칙하고, 매끄럽고 충돌이 없는 진행을 유도한다. 시뮬레이션과 실제 환경 실험 모두에서 검증된 본 방법은 공간-메모리 주의와 보상 설계를 통해 로봇-군중 상호작용의 비선형 동역학을 모델링하는 데 효과가 있음을 보여주며, 안전하고 적응적인 내비게이션을 달성한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.