최근 트랜지스터 집적도 향상이 점차 어려워짐에 따라, 단일 GPU의 연산 성능을 지속적으로 향상시키기 위한 방안으로 multi-chip-module (MCM) GPU가 제안되었다. 그러나, MCM GPU는 여러 칩렛이 속도가 느린 오프-칩 인터커넥트를 통해 연결되어 칩렛 간 데이터 전송 시 성능 저하를 초래한다. 본 논문은 가상 메모리 환경에서 페이지 테이블 워크 과정 중 빈번한 리모트 메모리 접근으로 인한 문제를 해결하고자, MCM GPU의 페이지 워크 시 리모트 페이지 테이블 엔트리 (PTE)를 로컬 L2 캐시에 캐싱하는 구조를 제안한다. 제안하는 구조는 리모트 PTE를 로컬 캐시에만 저장하는 방식과 로컬 및 리모트 캐시에 모두 저장하는 두 가지 방법으로 구현되었으며, 이를 바탕으로 각 방식이 페이지 워크 지연 감소에 미치는 효과를 실험을 통해 분석한다. 실험 결과, 두 방식 모두 기존 구조 대비 페이지 워크 지연 시간을 51.8% 이상 단축하였으며 최대 1.7배의 성능 향상을 달성함을 확인하였다. 이러한 결과는 리모트 페이지 워크가 MCM GPU의 주소 변환 성능에 미치는 영향을 시사하며, 효과적인 PTE 캐싱 구조가 성능 개선에 기여할 수 있음을 보여준다.