기본 정보
연구 분야
프로젝트
발행물
구성원
연구 영역
대표 연구 분야
연구실이 가장 잘하는 대표 연구 분야
1

프로세서 구조 및 이기종 멀티코어 시스템

이 연구 주제는 CPU와 GPU를 포함한 다양한 연산 자원의 구조를 이해하고, 이를 더 높은 성능과 전력 효율로 동작시키기 위한 마이크로아키텍처 및 시스템 수준의 최적화를 다룬다. 연구실의 핵심 관심사는 단순히 코어 수를 늘리는 데 그치지 않고, 워크로드의 특성에 따라 서로 다른 성능 특성을 지닌 코어들을 어떻게 배치하고 활용할 것인지에 있다. 특히 멀티코어 및 이기종 멀티코어 환경에서 스케줄링, 자원 분배, 병렬성 활용을 정교하게 설계함으로써 실제 응용에서 체감 가능한 성능 향상을 목표로 한다. 구체적으로는 워프 스케줄링, 레지스터 파일 관리, 캐시 활용도 개선, TLB 및 메모리 주소 변환 최적화, 명령어 재사용, 병렬 실행 효율 향상과 같은 저수준 구조 연구가 포함된다. 연구실의 특허와 학술발표에서 확인되듯 강화학습 기반 이기종 멀티코어 스케줄링, GPU 시뮬레이션 가속, 스레드 수준 병렬성 증대, 명령어 발행 구조 개선 등은 이러한 방향을 잘 보여준다. 이는 단일 칩 내부 구조부터 운영 환경에서의 실행 정책까지 아우르는 종합적인 접근이며, 성능만이 아니라 에너지 효율과 확장성까지 함께 고려하는 것이 특징이다. 이 연구는 모바일 기기, 임베디드 시스템, 데이터센터 서버, AI 반도체 플랫폼 등 폭넓은 응용으로 연결된다. 다양한 연산 장치가 혼재하는 최신 컴퓨팅 환경에서는 하드웨어 구조와 시스템 소프트웨어의 공동 설계가 점점 더 중요해지고 있으며, 연구실은 이러한 흐름 속에서 고성능·저전력 컴퓨팅의 기반 기술을 제시하고 있다. 결과적으로 본 주제는 차세대 시스템반도체와 고성능 컴퓨팅 플랫폼의 설계 원리를 제공하는 핵심 축이라 할 수 있다.

프로세서구조멀티코어GPU스케줄링마이크로아키텍처
2

AI 하드웨어 가속기와 메모리 계층 구조

이 연구 주제는 인공지능과 머신러닝 워크로드를 빠르고 효율적으로 처리하기 위한 하드웨어 가속기 시스템을 설계하는 데 초점을 둔다. 대규모 신경망과 거대 언어 모델은 막대한 연산량과 메모리 대역폭을 요구하기 때문에, 범용 프로세서만으로는 성능과 전력 측면에서 한계가 뚜렷하다. 이에 따라 연구실은 GPU, NPU, 텐서 연산기, 합성곱 연산 장치와 같은 전용 가속기 구조를 탐구하고, 실제 AI 응용에 적합한 시스템 아키텍처를 제안한다. 특히 연구실은 메모리 병목을 해결하기 위한 계층 구조 재설계에 강점을 보인다. 고성능 Multi-GPU 시스템 메모리 연구, PIM 활용 소프트웨어 플랫폼 개발, LLM 서버에서 HBM-DIMM-CXL-SSD로 이어지는 새로운 메모리 계층 구조 연구는 이러한 흐름을 대표한다. 단순히 메모리 용량을 확장하는 것이 아니라, Processing-in-Memory와 In-Storage Computing 같은 개념을 도입하여 데이터 이동을 줄이고, 메모리 근처에서 직접 연산을 수행하도록 함으로써 전체 시스템 효율을 높이는 방향을 지향한다. 또한 시뮬레이션 기반 데이터센터 분석 플랫폼 개발 과제를 통해 대규모 AI 워크로드에 적합한 서버 구성을 정량적으로 도출하는 연구도 병행하고 있다. 이 연구의 중요성은 AI 시대의 컴퓨팅 비용 구조를 바꾸는 데 있다. 오늘날 AI 서비스의 경쟁력은 모델 자체뿐 아니라 이를 얼마나 적은 전력과 비용으로 빠르게 구동할 수 있는지에 의해 좌우된다. 연구실의 접근은 칩 수준 가속기 설계, 메모리 시스템 혁신, 시스템 소프트웨어 및 프로파일링 도구 개발을 하나의 연속선에서 다룬다는 점에서 강력하다. 이는 데이터센터 AI 인프라, 엣지 AI 장치, 차세대 시스템반도체 산업 전반에 직접적인 파급효과를 지닌다.

AI가속기메모리계층PIMLLM서버데이터센터
3

멀티미디어 처리와 병렬 코덱 최적화

이 연구 주제는 영상 부호화, 트랜스코딩, 미디어 스트리밍과 같은 멀티미디어 처리의 계산 복잡도를 낮추고 실시간성을 확보하기 위한 알고리즘 및 시스템 최적화를 다룬다. 연구실은 HEVC를 중심으로 코딩 유닛 깊이 결정, 참조 의존성 분석, 공간 해상도 다운스케일링, 트랜스코딩 오프로딩과 같은 문제를 연구해 왔으며, 이는 모바일 및 네트워크 환경에서 고품질 영상 서비스를 실현하기 위한 기반 기술이다. 특히 영상 압축 기술은 높은 압축 효율과 막대한 연산량이 동시에 요구되므로, 알고리즘과 하드웨어 구조의 긴밀한 결합이 필수적이다. 연구실의 대표 논문들은 이러한 방향을 구체적으로 보여준다. 신경망을 이용한 HEVC CU 깊이 결정 연구는 영상 및 인코딩 특성을 함께 활용해 복잡도를 크게 낮추었고, 참조 의존성 그래프를 이용한 병렬화 연구는 HEVC 인코더와 디코더의 확장성을 향상시켰다. 또한 pseudo-quadtree 구조를 활용한 다운스케일링 트랜스코더 연구는 디코딩 과정에서 얻은 정보를 인코딩 가속에 재사용하는 방식으로 효율을 끌어올렸다. 이는 전통적 멀티미디어 알고리즘에 기계학습과 병렬 시스템 설계를 접목한 사례로 볼 수 있다. 이 연구는 모바일 기기, 스트리밍 서버, 클라우드 미디어 플랫폼, 실시간 영상 분석 시스템에 폭넓게 적용될 수 있다. 고해상도 영상과 초저지연 서비스가 보편화되는 환경에서, 연산량을 줄이면서도 화질 저하를 최소화하는 기술은 산업적으로 매우 중요하다. 더 나아가 연구실의 성과는 비디오 코덱 최적화 경험을 바탕으로 이미지·비전 처리 및 AI 기반 멀티미디어 응용으로 확장될 수 있으며, 고성능 컴퓨팅과 미디어 시스템의 융합 연구라는 점에서 의미가 크다.

HEVC트랜스코딩병렬처리신경망멀티미디어