마이크로서비스 아키텍처는 인프라 관리의 높은 효율성과 대규모 사용자 서비스 제공 능력으로 인해 클라우드 컴퓨팅을 위한 강력한 패러다임으로 부상해 왔다. 클라우드 제공자는 자동 스케일링과 프로비저닝과 같은 지속적으로 변화하는 수요를 충족하기 위해 유연한 자원 관리가 필요하다. 상용 및 오픈소스 컴퓨팅 플랫폼 모두에서 사용되는 일반적인 접근법은 워크로드 기반 자동 스케일링으로, 유입 요청의 수를 늘려 인스턴스를 확장한다. 동시성(Concurrency)은 최근 진화하는 마이크로서비스 프레임워크에서 제안된 요청 기반 정책이며, 이 정책에서는 알고리즘이 각 인스턴스에서 병렬로 처리하도록 구성된 최대 요청 수까지 자원을 확장할 수 있다. 그러나 워크로드와 인프라 특성의 복잡성에 따라 처리량과 지연 시간이 달라질 수 있는 여러 요인이 존재하므로, 최상의 서비스 품질을 제공하는 동시성 구성(concurrency configuration)을 식별하는 데는 어려움이 있음이 입증되었다. 따라서 본 연구는 마이크로서비스 프레임워크에서 요청 기반 자동 스케일링에 인공지능 접근법을 적용할 수 있는지 검증하고자 하였다. 그 결과, 제안된 모델은 제한된 수의 pod 내에서 효과적인 확장 정책을 학습할 수 있었으며, 기반이 되는 자동 확장 구성(underlying auto expansion configuration) 대비 향상된 성능을 보였다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.