* 본 과제의 아이디어는 CPU 프로그래밍과 GPU 프로그래밍의 특성이 다르다는 점에서 착안
- CPU는 분기 패널티가 없고, SSE/AVX2 등의 명령어를 통해 직접 SIMD 유닛에 연산을 매핑할 수 있기 때문에, 알고리즘 구현에 있어서 자유도가 높음. 다만 일반 데스크탑 환경(8코어 이하)에서의 절대적인 연산 성능은 최신 GPU 대비 낮음.
- GPU는 SIMT (single instruction, multiple threads) 형태로 같은 명령어가 여러 쓰레드에 걸쳐서 동시에 수행되는 형태이기 때문에, 효율적인 알고리즘 구현에 있어서 제약이 많음. 하지만 높은 연산량을 요구하는 고품질 텍스쳐 인코딩의 경우, GPU의 높은 연산 성능을 제대로 활용 가능.
* 이러한 점을 이용하여 CPU와 GPU와 구조에 맞게 텍스쳐 인코딩 작업을 분리
- 1차 CPU 처리: 고속 압축 알고리즘을 적용하여 인코딩.
- 2차 GPU 처리: 1차 처리에서 눈에 띄는 결점(artifacts)을 보이는 problematic block에 대해서만 GPU로 전송한 후, GPU의 병렬 셰이더 코어를 이용하여 이들을 고품질로 재압축.
- 이 두 작업은 파이프라인화되도록 설계, CPU와 GPU가 가능한 한 동시에 작동되도록 함
- 더블 버퍼링 (double buffering) 방식으로 블록이 저장되는 메모리 공간을 활용. 이를 통해, n-1개의 쓰레드가 병렬 고속 압축을 수행하는 동안, 1개의 쓰레드는 GPU와의 커뮤니케이션을 수행하고 최종 이미지를 조합하는 역할을 수행.
* 하이브리드 CPU/GPU 인코딩 알고리즘을 세부적으로 구현하기 위해 다음과 같은 사항들에 대한 연구개발이 필요하며, 다차년도에 걸쳐 이를 수행할 예정
- State-of-the-art CPU/GPU 인코딩 알고리즘 분석 및 실험 환경/체계 구축 (1차년도)
- Problematic block에 대해 분리 수행이 가능한 CPU 기반 고속 인코더 개발 (2차년도)
- GPU의 연산 능력을 효과적으로 활용 가능한 GPU 기반 고속 인코더 개발 (2차년도)
- 파이프라인화된 고속 CPU/GPU 하이브리드 인코더 개발 (3차년도)
* 이러한 점을 이용하여 CPU와 GPU와 구조에 맞게 텍스쳐 인코딩 작업을 분리
- 1차 CPU 처리: 고속 압축 알고리즘을 적용하여 인코딩.
- 2차 GPU 처리: 1차 처리에서 눈에 띄는 결점(artifacts)을 보이는 problematic block에 대해서만 GPU로 전송한 후, GPU의 병렬 셰이더 코어를 이용하여 이들을 고품질로 재압축.
- 이 두 작업은 파이프라인화되도록 설계, CPU와 GPU가 가능한 한 동시에 작동되도록 함
- 더블 버퍼링 (double buffering) 방식으로 블록이 저장되는 메모리 공간을 활용. 이를 통해, n-1개의 쓰레드가 병렬 고속 압축을 수행하는 동안, 1개의 쓰레드는 GPU와의 커뮤니케이션을 수행하고 최종 이미지를 조합하는 역할을 수행.
* 하이브리드 CPU/GPU 인코딩 알고리즘을 세부적으로 구현하기 위해 다음과 같은 사항들에 대한 연구개발이 필요하며, 다차년도에 걸쳐 이를 수행할 예정
- State-of-the-art CPU/GPU 인코딩 알고리즘 분석 및 실험 환경/체계 구축 (1차년도)
- Problematic block에 대해 분리 수행이 가능한 CPU 기반 고속 인코더 개발 (2차년도)
- GPU의 연산 능력을 효과적으로 활용 가능한 GPU 기반 고속 인코더 개발 (2차년도)
- 파이프라인화된 고속 CPU/GPU 하이브리드 인코더 개발 (3차년도)
본 프로젝트는 그래픽스와 사운드가 실제처럼 보이고 들리게 만드는 핵심 기술인 광선 추적법을 더 빠르고 효율적으로 구현하기 위한 연구임. 특히 세계적 연구 환경에서 새로운 렌더링 기술과 국제적 연구 역량을 함께 확장하는 연수 기반 연구임.
연구 목표는 그래픽스와 사운드 렌더링에 활용되는 실시간 광선 추적 기술을 발전시키고 국제적 연구 경험을 확보하는 데 있음. 핵심 연구 내용은 트리 탐색 가속 알고리즘 개선, LOD 기반 광선 추적 기법 개발, 그래픽스와 사운드를 동시에 가속하는 하드웨어 구조 설계임. 기대 효과는 게임·영상 제작·VR/AR·고성능 컴퓨팅 분야에서 현실감 향상, 제작 효율 증대, 실시간 시뮬레이션 성능 향상 등을 제공함.
광선 추적 방식을 갖는 차세대 내장형 렌더링 프로세서 IP 연구 및 개발한다. 1. 내장형에 적합한 광선 추적 렌더링 하드웨어 및 소프트웨어 구조 제시한다. 내장형 광선 추적 렌더링 처리 알고리즘 및 구조와 제안하는 하드웨어 구조와 연동하는 소프트웨어 처리 방안을 제시한다. 2. 제안하는 구조의 시뮬레이션 환경 및 동작 검증 환경 구축한다. 제안하는 구조에...