클라우드 환경은 확장 가능한 컴퓨팅 인프라에서 대규모 데이터 집합을 분석할 수 있게 한다. 생물정보학 분야에서 해당 응용은 복잡한 워크플로 작업들로 구성되며, 막대한 데이터 저장 공간과 계산 집약적인 병렬 작업 부하를 요구한다. 분산 해법에서 많은 접근법들이 제안되어 왔다. 그러나 이들은 로컬 컴퓨팅 팜에서 배치 처리 방식에 따라 정적 자원 할당 및 데이터 저장에 초점을 맞추는 경향이 있다. 대규모 워크플로 시스템의 경우, 자원 비용을 절감하기 위해 전체 또는 일부 작업을 공용 클라우드에 외주화하는 것은 피할 수 없고 또한 가치가 있다. 다만 이러한 문제는 대규모 데이터셋의 전송 시점에서 발생할 수 있으며, 서로 다른 문제 크기에 대한 완료 시간이 불균형하게 나타나는 문제도 있다. 본 논문에서는 데이터 전송 시간을 은폐하기 위한 실행 시간 데이터 분배 및 수집 서비스를 포함하는 적응형 자원-프로비저닝 기법을 제안한다. 제안한 적응형 자원-프로비저닝 기법은 자원 제약 하에서 총 makespan을 최소화하기 위해, 서로 다른 데이터셋에 할당되는 컴퓨팅 요소의 할당 비율을 최적화한다. 우리는 널리 알려진 서열 정렬 알고리즘을 사용하여 실험을 수행하였고, 그 결과 제안한 기법이 클라우드 환경에서 효율적임을 확인하였다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.