본 연구는 자율 이동 로봇의 동적 제어를 위해 강화학습 기반의 최적화 알고리즘을 제안한다. 실시간 환경 변화에 반응하여 적응 가능한 제어 정책을 학습하며, 동작 안정성 및 경로 계획 효율을 동시에 확보할 수 있는 프레임워크를 설계하였다. 실내외 다양한 조건에서의 시뮬레이션 및 실제 로봇 실험을 통해 제안 기법의 실효성을 검증하였다. 학습된 정책은 동작 속도와 에너지 효율 측면에서도 기존 제어기 대비 우수한 성능을 보였으며, 로봇의 복원성 확보에도 기여함을 확인하였다.