Differential Image-Based Scalable YOLOv7-Tiny Implementation for Clustered Embedded Systems | 박대진 교수 연구실 | 경북대학교 대학원 전자전기공학부

박대진 교수 연구실

홈

기본 정보

연구 분야

프로젝트

논문

구성원

article|

인용수 2

·2024

Differential Image-Based Scalable YOLOv7-Tiny Implementation for Clustered Embedded Systems

Sunghoon Hong, Daejin Park

IF 8.4 (2024) IEEE Transactions on Intelligent Transportation Systems

초록

강력한 시각 이미지 분석을 위한 합성곱 신경망(convolutional neural networks, CNNs)은 인공지능 분야에서 점차 인기를 얻고 있다. 다른 인공 신경망과 비교했을 때 CNN의 주요 차이점은 영상 분류에 필요한 특성 맵(feature map)을 추출함으로써 시각 이미지 분석 성능을 향상시키기 위해 다수의 합성곱 층이 추가된다는 점이다. 그러나 제한된 처리 자원을 갖춘 엣지 컴퓨팅 모듈에서 저지연이 요구되는 응용을 실행하기 위해서는 알고리즘 최적화가 필요하다. 본 논문에서는 연속 미분 이미지(continuous differential images)를 활용하여 빠른 CNN을 위한 새로운 알고리즘 최적화 방법을 제안한다. 핵심 아이디어는 각 합성곱 층에서 입력의 미분 값(differential value)을 사용하여 연산을 변동적으로 감소시키는 것이다. 또한 제안 방법은 모든 유형의 CNN과 호환되며, 연속 이미지의 픽셀 값 차이가 낮을수록 성능이 더 우수하다. 우리는 DarkNet 프레임워크를 사용하여 클러스터링된 시스템에서 빠른 합성곱(fast convolution) 및 반(half) 합성곱(half convolution) 접근법으로 알고리즘을 평가하였다. 그 결과, 입력 프레임 속도가 10 fps일 때 FLOPs는 원래의 YOLOv7-tiny에 비해 약 4.92배 감소하였다. 합성곱 층의 FLOPs를 줄임으로써 추론 속도는 약 4.86 FPS로 향상되었으며, 이는 원래 YOLOv7-tiny에 비해 1.57배 더 빠른 속도이다. 반 합성곱 접근법을 위해 엣지 컴퓨팅 모듈 2개를 사용한 병렬 처리의 경우 FLOPs는 더 크게 감소하였고 응답 속도도 향상되었다. 더 나아가 확장 가능한 클러스터드 임베디드 시스템에서 최대 7개의 컴퓨트 모듈까지 사용자 원하는 만큼 추가로 확장함으로써, 더 빠른 객체 검출 구현이 가능하다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

Computer scienceScalabilityArtificial intelligenceEmbedded systemComputer visionOperating system

타입

article

IF / 인용수

8.4 / 2

원문

https://doi.org/10.1109/tits.2024.3419095

게재 연도

2024

프로젝트 공고 서비스 문의 자주 묻는 질문 이용약관 개인정보처리방침

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)