클라우드 컴퓨팅 분야에서의 최근 발전으로 서버리스(serverless) 기술이 도입되어, 클라우드 네이티브 애플리케이션을 편리하고 유연하게 관리할 수 있게 되었다. 일반적으로 함수형 서비스(Function-as-a-Service, FaaS) 솔루션은 오토스케일링과 파드(pod) 스케줄링을 포함하는 기반 컨테이너화된 환경에 대한 자원 관리의 이점을 활용하기 위해 Kubernetes(K8s) 및 Knative와 같은 서버리스 백엔드 솔루션에 의존한다. 이러한 이점을 취하기 위해 최근의 클라우드 서비스 제공자들은 상용 퍼블릭 클라우드 제공자에 의존하기보다는, 온프레미스에 호스팅된 FaaS 플랫폼을 제공함으로써 자체 호스팅 서버리스 서비스를 배포하고 있다. 그러나 서버리스 컴퓨팅에서 이와 같은 온프레미스 호스팅 환경의 오토스케일링 구성 옵션에 대해 자원을 공정하게 스케줄링하고 할당하기 위한 K8s 추상화(abstraction)와 관련된 표준화된 지침의 부재는, 다양한 워크로드의 서비스 수준 목표(SLOs)를 충족하는 데 어려움을 야기한다. 본 연구는 K8s에서 스케일링 관련 구성에 따라 FaaS 워크로드의 성능이 오토스케일링 거동과 어떤 관계를 갖는지 탐구함으로써 이러한 공백을 메운다. 종합적인 측정 연구에 기반하여, 베이스 메트릭(base metric), 지연(latency) SLO의 차이를 최대화하기 위한 임계값(threshold), 응답 수(number of responses)와 같은 스케일링 구성의 유형을 포함하여, 어떤 워크로드를 어떤 형태의 스케일링 구성으로 적용해야 하는지에 대한 로직을 도출하였다. 또한 관련 K8s 구성의 스케일링 효율을 FaaS 워크로드의 서비스 품질(QoS)과 관련하여 평가하기 위한 방법론을 제안한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.