연구 영역
기본 정보
논문·특허
과제
구성원
읽는 시간 · 1분 59초

엣지/모바일 협력 DNN 추론 오프로딩과 의미 기반 압축·전송 연구

DNN Inference Offloading with Semantic Compression for Edge/Mobile Collaboration

연구 내용

무선 자원과 모바일 제약을 고려해 DNN 추론을 엣지로 오프로딩하고, 의미 기반 압축과 시스템 스케줄링으로 지연-에너지 효율을 개선하는 연구

모바일 기기에서 수행되는 DNN 추론을 엣지 서버로 옮기는 과정에서 지연과 에너지 효율이 동시에 저하되는 문제를 다룹니다. Coactive inference offloading 개념에 기반해 모델 분할을 넘어 모바일-네트워크-서버 자원을 동시 실행 관점에서 스케줄링하는 시스템을 구성합니다. 또한 연산이 일정 시간 내에 끝나야 하는 제약에서 주파수 스케일링을 지연 조건 내로 분산시키는 방식으로 에너지 비효율을 완화합니다. 통신 구간에서는 필수 의미 정보만 추출해 전송하는 semantic offloading과, 생성 모델 기반 compressive transmission으로 전송량을 줄이는 방법을 결합해 end-to-end 지연 안정성을 목표로 합니다. 추가로 OS 커널의 소켓 버퍼 처리와 3D 비디오 파라미터 전달 같은 통신·렌더링 요소 최적화도 함께 다룹니다.

관련 연구 성과

관련 논문

7

관련 특허

0

관련 프로젝트

5

연구 흐름

초기 연구는 모바일 추론 오프로딩의 기본 동작을 정리하고, 대역폭과 무선 변동 환경에서 end-to-end 성능을 흔드는 병목을 식별하는 데 집중되었습니다. 이후 2024년에는 오프로딩을 단순 분할이 아닌 자원 동시성 중심으로 재구성하는 CoActo로 확장되었고, 추론 타이밍 제약 하에서 지연과 에너지를 동시에 맞추기 위한 운영 전략으로 NeuroBalancer 계열의 설계가 이어졌습니다. 2025년에는 의미 기반 전송(N-epitomizer), 생성 모델 기반 무손실 압축 전송(nCTX), 모바일 커널 수준 지연-부하 최적화(ADQ), 파라미터화 통신을 통한 몰입형 3D 회의(Empilo)로 통신 구간 효율화가 강화되는 흐름을 보입니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

  • 엣지 보조 온디바이스 AI
  • 지연 민감 추론 서비스
  • 무선 변동 환경의 안정적 전송
  • DNN-aware 의미 기반 압축
  • 에너지 효율형 모바일 추론
  • 실시간 멀티미디어 스트리밍 최적화
  • 모바일 커널 네트워크 처리 최적화
  • 파라미터화 3D 원격 협업
  • 확장 가능한 오프로딩 프레임워크
  • 온디바이스 프라이버시 보존 추론

관련 논문

구분

제목

1

CoActo: CoActive Neural Network Inference Offloading with Fine-grained and Concurrent Execution

2

NeuroBalancer: Balancing System Frequencies With Punctual Laziness for Timely and Energy-Efficient DNN Inferences

3

N-Epitomizer: A Semantic Offloading Framework Leveraging Essential Information for Timely Neural Network Inferences

4

nCTX: A Neural Network-Powered Lossless Compressive Transmission Using Shared Information

5

ADQ: Application-Aware Socket Buffer Dequeueing for Mobile Devices

6

Empilo: Realizing Immersive Mobile 3D Video Conferencing through Parameterized Communication

7

End-to-End Coordination of RAN and Edge Server for Latency-Critical Inference Serving over Cellular Networks

관련 프로젝트

구분

제목

1

클라우드-네이티브 이동통신 시스템 원천기술 개발 및 리더십 구축

2

클라우드-네이티브 이동통신 시스템 원천기술 개발 및 리더십 구축

3

클라우드-네이티브 이동통신 시스템 원천기술 개발 및 리더십 구축

4

오픈랜인력양성프로그램 (카이스트-서울대)

5

5G-A vRAN 연구플랫폼 개발