전력 스케줄링에 대한 새로운 접근법을 제안하며, 경제적 영향과 환경적 영향을 모두 최소화하는 데 초점을 둔다. 이 방법은 에이전트 기반 시뮬레이션 환경 내에서 딥 컨텍추얼 강화학습(RL)을 활용한다. 각 발전 단위는 독립적이고 이질적인 에이전트로 취급되며, 스케줄링 동역학은 마르코프 결정 과정(MDP)으로 정식화된다. 이후 MDP를 사용하여 최적의 전력 스케줄을 결정하기 위한 딥 RL 모델을 학습한다. 본 접근법의 성능은 소규모 및 대규모를 포함한 다양한 전력 시스템에서 평가되었으며, 최대 100개 단위를 포함한다. 그 결과, 제안된 방법은 더 많은 수의 단위를 갖는 전력 시스템을 처리함에 있어 우수한 성능과 확장성을 보이는 것으로 나타났다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.