통합 가상 메모리(Unified Virtual Memory, UVM)는 GPU 프로그래밍을 단순화하고 메모리 오버서브스크립션을 지원하지만, 페이지 폴트 오버헤드와 스래싱(thrashing)으로 인해 높은 메모리 압력 하에서 심각한 성능 저하를 겪는다. 사전(prefetching), 접근 카운터 기반 마이그레이션, 동적 Zero-copy와 같은 기존 접근법은 제한적인 이점을 제공하며 종종 하드웨어 또는 컴파일러 수정이 필요하여, UVM의 이식성과 배포 용이성을 저해한다. 본 연구에서는 UVM의 GPU 메모리 추상화를 보존하면서 메모리 오버서브스크립션 하에서도 높은 수준의 견고한 성능을 보장하는 런타임 UVM 관리 프레임워크 ARIADNE을 제시한다. ARIADNE은 세 가지 원칙에 의해 안내된다: (1) 마이그레이션 지연을 숨기기 위한 파이프라인화된 폴트 처리, (2) 하드웨어나 컴파일러 변경 없이도 스레드 수준의 접근 국소성을 포착하는 런타임 지표인 Sharing Degree를 통해 배치 결정을 정보화하고, (3) 실시간 접근 패턴에 따라 GPU 메모리와 Zero-copy 사이에서 메모리 영역을 동적으로 배치한다. ARIADNE은 NVIDIA의 UVM 드라이버 내부에서 완전히 구현되었으며, 재컴파일이나 하드웨어 수정이 필요 없고 모든 실행 파일 또는 폐쇄형(Closed-source) GPU UVM 응용에 대해 투명하게 적용된다. 실험 결과는 ARIADNE이 각각 1.9 ×, 5.0 ×, 4.8 ×의 평균 속도 향상을 상태 최신 기법 대비 제공하며, 및 300 % 오버서브스크립션에서 스래싱을 효과적으로 방지하면서 거의 선형적인 성능 스케일링을 유지함을 보여준다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.