RnDCircle Logo
김용우 연구실
한국교원대학교 기술교육과 김용우 교수
Edge AI
Real-time Object Detection
Quantization
연구 영역
기본 정보
논문·특허
과제
구성원

김용우 연구실

한국교원대학교 기술교육과 김용우 교수

김용우 연구실은 온디바이스 환경에서 실시간 비전 인식과 효율적인 영상 처리를 구현하기 위한 연구를 수행합니다. 구체적으로 CNN 기반 추론을 정수 연산 중심으로 재구성하기 위해 양자화 및 QAT를 적용하고, 네트워크 프루닝과 적응형 스케일링으로 연산량과 자원 사용을 줄이는 최적화 기법을 개발합니다. 또한 FPGA 등 하드웨어 관점의 데이터플로와 스트리밍 아키텍처를 설계공간 탐색과 결합하여 지연과 전력 제약을 만족하도록 구현합니다. 더불어 원격탐사 영상에서 공간–분광 가변 압축이 유발하는 아티팩트를 다중도메인 학습과 하이브리드 어텐션으로 복원하는 연구도 병행합니다.

Edge AIReal-time Object DetectionQuantizationPruningFPGA Accelerator
대표 연구 분야
연구 영역 전체보기
온디바이스 실시간 비전 인식용 양자화·프루닝·하드웨어 공동설계 연구 thumbnail
온디바이스 실시간 비전 인식용 양자화·프루닝·하드웨어 공동설계 연구
Edge Real-Time Vision Recognition via Quantization, Pruning, and Algorithm–Hardware Co-Optimization
연구 분야 상세보기
연구 성과 추이
표시된 성과는 수집된 데이터 기준으로 산출되며, 일부 차이가 있을 수 있습니다.
주요 논문
5
논문 전체보기
1
Article
|
인용수 0
·
2025
Efficient Hardware-Assisted Heap Memory Safety for Embedded RISC-V Systems
Hyunjae Park, Yonghae Kim, Dongwook Kang, Hongil Ju, Gaeil An, Yongwoo Kim
IF 3.6 (2025)
IEEE Access
최근 수년간 임베디드 환경에서의 메모리 안전성 이슈는 큰 주목을 받아 왔으며, 힙 메모리에서 발생하는 공간적 및 시간적 메모리 위반은 중요한 보안 위협으로 부상하고 있다. 이러한 과제에 대응하기 위해, 본 논문은 RISC-V 순차(in-order) 프로세서를 대상으로 하는 효율적인 태그 기반 메모리 검증 시스템을 제안한다. 제안된 시스템은 하드웨어 수준의 리플레이(replay) 메커니즘을 통합함으로써 성능 오버헤드를 최소화하도록 설계되었으며, Heap Check Cache(HC-Cache), FIFO Buffer, Store Head Buffer/Clear Head Buffer(SHB/CHB)를 포함한다. 소프트웨어 측면에서는 메타데이터 관리와 태그 생성의 자동화를 위해 확장된 RISC-V ISA 명령 및 수정된 Newlib C 라이브러리를 채택하였고, 사용자 애플리케이션에 대한 추가적인 수정 요구 없이 동작한다. 본 시스템은 Xilinx VC707 보드를 사용한 FPGA 플랫폼에서 구현되었다. 구현 결과, BRAM(0.66%) 및 LUTRAM(0.99%)에 대해서는 최소 오버헤드를 유지하면서 LUT는 16.07% 증가, Flip-Flops는 58.25% 증가하는 것으로 나타났다. Mibench, Olden, SPEC2006과 같은 워크로드를 이용한 성능 평가는 기존 연구에 비해 평균 성능 오버헤드가 유의하게 낮음을 보여주었다. 또한 NIST Juliet Test Suite 1.3을 사용한 검증 결과, 본 시스템은 1,924건의 힙 기반 오버플로우, 803건의 double-free 오류, 394건의 use-after-free 오류를 포함한 힙 관련 취약점의 100%를 성공적으로 탐지하였다. 이러한 결과는 제안된 시스템이 자원이 제한된 임베디드 환경에서도 높은 보안성과 성능 효율을 제공함을 입증한다.
https://doi.org/10.1109/access.2025.3570777
Computer science
Embedded system
Memory safety
Heap (data structure)
Memory protection
Operating system
Parallel computing
Computer hardware
Memory management
Overlay
2
Article
|
인용수 1
·
2025
LLTQ+: A Hardware-Friendly Quantization Framework for Modern YOLO Architectures
Yugwon Seo, Jaemyung Kim, Jin-Ku Kang, Yongwoo Kim
IF 3.6 (2025)
IEEE Access
YOLO 기반 객체 검출 모델은 높은 정확도와 빠른 추론 속도 덕분에 실시간 응용 분야에서 널리 사용된다. 그러나 복잡한 아키텍처와 높은 계산 요구량은 저전력 엣지 디바이스에 배포하는 데 있어 어려움을 야기한다. 이를 해결하기 위해, 하드웨어 친화적 양자화 기법인 LLTQ의 향상 버전인 LLTQ+를 제안한다. 제안된 접근법은 Quantization-Aware Training(QAT) 동안 배치 정규화(batch normalization) 계층을 보존하여 학습 안정성과 정확도를 유지하며, YOLO 네트워크의 핵심 구조 구성 요소인 RepConv의 표현력을 보존하는 양자화 전략을 도입한다. PASCAL VOC 데이터셋에 대한 실험 결과는 LLTQ+의 효과를 입증한다. YOLOv10-s에서 LLTQ+는 정수 전용 추론(integer-only inference) 조건에서 mAP(0.5) 80.6%, mAP(0.5:0.95) 61.8%를 달성했으며, 이는 각각 LLTQ 대비 0.9 및 1.7 퍼센트 포인트를 상회한다. YOLOv9-t에서는 LLTQ+가 mAP(0.5:0.95) 52.9%를 달성하여 LLTQ 대비 0.5 포인트 향상되었다. YOLOv7 및 YOLOv7-tiny와 같은 다른 아키텍처에서도 일관된 성능 향상이 관찰되었다. 이러한 결과는 LLTQ+가 최신의 더 복잡한 YOLO 네트워크에 대해서도 정수 양자화를 효과적으로 지원함을 확인해 주며, 정확도와 계산 효율 간의 균형을 이루는 실용적인 양자화 해법을 제공한다.
https://doi.org/10.1109/access.2025.3603536
Computer science
Quantization (signal processing)
Computer architecture
Environmentally friendly
Architecture
Embedded system
Computer vision
3
Article
|
·
인용수 3
·
2023
MASCAR: Multidomain Adaptive Spatial–Spectral Variable Compression Artifact Removal Network for Multispectral Remote Sensing Images
Jaemyung Kim, Hyun-Ho Kim, Doochun Seo, Jaeheon Jeong, Jin-Ku Kang, Yongwoo Kim
IF 7.5 (2023)
IEEE Transactions on Geoscience and Remote Sensing
원격탐사 환경에서 영상 압축은 제한된 대역폭과 저장 용량으로 인해 고해상도 영상을 효율적으로 전송하고 저장하기 위해 필수적이다. 그러나 압축은 흔히 영상 품질 저하를 초래하며, 이로 인해 후처리 단계에서 압축 아티팩트 제거 기술이 요구된다. 딥 신경망은 영상 복원에서 주목할 만한 성능을 보여 왔지만, 기존의 대부분 방법은 원격탐사 환경에 특화된 압축 조건을 충분히 고려하지 못했으며 주로 합성 데이터셋에서 평가되었다. 이러한 문제를 해결하기 위해, 본 연구에서는 원격탐사 환경에서 압축된 영상의 지표면 상세 정보를 효과적으로 복원하는 다중도메인 적응형 공간–분광 변수 압축 아티팩트 제거 네트워크(MASCAR)를 제안한다. 입력 국소 패치를 서로 다른 도메인으로 분해하여 다양한 특징을 추출하는 다중도메인 국소-패치 협업 학습 전략을 도입한다. 또한, 미세 텍스처 상세 복원으로 네트워크의 초점을 유도하고 국소 패치의 픽셀 분포에 상당한 편차가 있는 원격탐사 영상을 안정적으로 학습할 수 있도록 하는 상세 중심화 접근법을 제안한다. 더 나아가, 복원된 영상의 디테일을 향상시키기 위한 디테일 향상 접근법도 제시한다. 아울러, 원격탐사 환경에서 알려지지 않은 압축 비율에 유연하게 대응하기 위해 통합된 압축 영상 품질 적응 메커니즘을 제안한다. 제안한 방법을 적용한 MASCAR의 성능은 합성 및 실제 원격탐사 데이터셋에서 평가하였다. 실험 결과는 제안 방법이 기존 방법에 비해 정량적 성능과 시각적 품질이 더 우수함을 보여준다.
https://doi.org/10.1109/tgrs.2023.3347518
Computer science
Multispectral image
Remote sensing
Image compression
Artificial intelligence
Compressed sensing
Data compression
Computer vision
Pixel
Image resolution
최신 정부 과제
4
과제 전체보기
1
2022년 2월-2025년 2월
|25,152,000
온 디바이스 AI를 위한 경량 모델 압축 및 저복잡도, 저전력 하드웨어 가속 기술 연구
- 온 디바이스 AI를 위한 경량 모델 압축 기술(프루닝, 양자화) 연구- 에지 디바이스 상에서 실시간 객체 검출/추적 경량화 모델 개발-- 경량화된 모델을 구동하기 위한 하드웨어 가속 기술 연구- 저복잡도, 저전력 FPGA 딥러닝 하드웨어 가속기 개발
온디바이스 인공지능
에지 디바이스
하드웨어 가속기
압축 모델
네트워크 경량화
2
주관|
2022년 2월-2025년 2월
|31,440,000
온 디바이스 AI를 위한 경량 모델 압축 및 저복잡도, 저전력 하드웨어 가속 기술 연구
- 실시간 딥러닝 객체 탐지/추적 기술을 개발하기 위해 단계별 요소기술을 세분화하고, 기술 간의 연계 및 보완을 통해 연구 결과의 완성도를 높임 - 객체 탐지/추적 기술 연구 동향 분석 및 딥러닝 네트워크 경량화 기술을 적용하여 네트워크 최적화 - 하드웨어 구현을 위한 경량화된 네트워크에 최적화된 양자화 기술 연구 및 적용 - FPGA 하드웨어 가속기 설계시 HLS (High-Level Synthesis)를 통한 빠른 Prototyping - 객체 탐지/추적 알고리즘의 정수 연산 하드웨어 설계 완료 후 군집 드론 비행 시스템에 탑재 후 검증
온디바이스 인공지능
에지 디바이스
하드웨어 가속기
압축 모델
네트워크 경량화
3
주관|
2021년 4월-2027년 2월
|5,475,000,000
디지털 신기술 인재양성 혁신공유대학사업(차세대반도체)
본 과제는 차세대 반도체 분야를 이끌 인재를 만들기 위한 책임 있는 미래 인재양성 사업임. 연구목표는 다양한 전공 학생에게 진로 탐색 기회 제공을 위해 수준별 맞춤 교육을 운영하여 2,800명/년 이상 인력 양성 달성임. 핵심 연구내용은 초급·중급·고급·전문 단계 포함 11종 교과과정 운영, 산업체 요구 기반 PBL 강좌 연 18개 신설 및 45개 K-MOOC 개설, 유연학사제도 총 92건 운영, 교원 책임시수 감면·성과연봉 지원, 협약 100여개 기업 취업 연계 및 인턴·장학금 제공, KMOOC·교과과정 공동활용 확산과 재직자 교육 실행임. 기대효과는 반도체 비전공 인문·이공계 취업역량 강화 및 수료생의 현장 인터뷰 기반 직무능력 증대임
차세대 반도체
최신 특허
특허 전체보기
상태출원연도과제명출원번호상세정보
등록2018라인 단위 연산을 이용한 초해상화 방법 및 장치1020180091482
등록2018특징맵 압축을 이용한 이미지 처리 방법 및 장치1020180091484
등록2018이미지 파이프라인 처리 방법 및 장치1020180091485
전체 특허

라인 단위 연산을 이용한 초해상화 방법 및 장치

상태
등록
출원연도
2018
출원번호
1020180091482

특징맵 압축을 이용한 이미지 처리 방법 및 장치

상태
등록
출원연도
2018
출원번호
1020180091484

이미지 파이프라인 처리 방법 및 장치

상태
등록
출원연도
2018
출원번호
1020180091485