이기종·가상 메모리 계층의 동적 관리 연구

Dynamic Management for Heterogeneous and Virtual Memory Hierarchies

연구 내용

이기종 계층 메모리와 GPU 통합 가상 메모리에서 성능 저하 요인을 분석하고 캐시·프리페치·페이지 배치를 런타임에 동적으로 최적화하는 연구

이기종 메모리 계층에서 메모리 접근 지연 차이와 캐시 오염이 워크로드 성능을 좌우한다는 관점에서, NUMA interleaving 기반 이기종 메모리의 특성을 분석하고 LLC를 near/far 접근 요구에 맞게 분할·재구성하는 동적 캐시 관리 기법을 제안합니다. 또한 GPU의 Unified Virtual Memory(UVM)에서 페이지 폴트와 쓰래싱을 완화하기 위해 공유 상태를 반영한 프리페칭과, 런타임에서 접근 지역성을 지표화해 배치를 전환하는 oversubscription 제어를 수행합니다. FaaS 워크로드에 맞춘 페이지 승격·배치 정책도 함께 연구합니다.

관련 프로젝트

3건

연구 흐름

초기에는 tiered memory에서 NUMA interleaving이 특정 메모리 집약 워크로드에 미치는 상반된 영향을 규명하고, last-level cache를 near/far에 맞춰 재분할하는 T-CAT 계열의 동적 캐시 관리로 성능 열화를 완화하는 방향으로 연구를 수행했습니다. 이후 GPU 메모리 추상화인 Unified Virtual Memory(UVM)가 불규칙·혼합 패턴에서 부담을 갖는 문제에 주목하여, 접근 블록의 공유 특성을 기반으로 prefetching 전략을 조정하는 SAFE로 확장했습니다. 최근에는 FaaS의 단기 이벤트성 재사용 특성을 반영한 Hisui와, page fault 병목을 가리는 pipelined fault handling 및 공유도 기반 placement을 갖춘 ARIADNE로 런타임 메모리 관리 체계를 심화하고 있습니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

heterogeneous memory tiering 스케줄링
GPU Unified Virtual Memory(UVM) 성능 최적화
CXL-DRAM 기반 near/far 접근 제어
dynamic cache partitioning 정책 엔진
UVM page fault 처리 파이프라이닝
sharing-aware prefetching 튜닝
memory oversubscription 쓰래싱 억제
FaaS 워크로드용 페이지 승격 정책
드라이버 기반 투명 런타임 배치
메모리 중심 고성능 컴퓨팅 플랫폼