머신러닝을 탑재한 로봇의 적용 분야는 서빙 로봇이나 안내 로봇과 같은 영역으로 확장되고 있으나, 로봇에 머신러닝을 적용하는 일은 사람의 개입이 필요하여 노동 비용이 크다. 본 논문은 두 대의 로봇 사이에서 물체를 균형 있게 배치하는 과제를 성공적으로 수행하면서 인간 개입을 최소화하기 위한 대화형 로봇-로봇 강화학습 기술을 제안한다. 제안된 기법에서는 교사 로봇과 학생 로봇이 강화학습에 기반하여 물체 균형을 지도하고 학습한다. 교사 로봇은 사전에 학습되지 않은 지식을 학생 로봇에게 가르치며, 학습 결과에 대해 다양한 긍정 및 부정의 텍스트 피드백을 제공함으로써 보다 효과적으로 교육한다. 가상 시뮬레이션에서, 제안 방법의 평가 결과로서 학생 로봇의 학습 결과는 최적 정책에 수렴하며, 학습된 학생 로봇은 교사의 임의 행동에 의해 다양한 테이블 상태에 따라 적절한 행동을 수행한다. 우리의 실험 결과를 통해 로봇-로봇 학습의 적용 가능성이 인간-로봇 학습과 동등한 수준임을 검증하였다. 또한 제안 방법은 IoT 환경에서 이질적인 로봇이나 에이전트에 학습 모델을 적용하기 어려운 경우, 학습된 지식을 원활하게 전이하는 데 활용될 수 있다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.