강력한 시각 이미지 분석을 위한 합성곱 신경망(convolutional neural networks, CNNs)은 인공지능 분야에서 점차 인기를 얻고 있다. 다른 인공 신경망과 비교했을 때 CNN의 주요 차이점은 영상 분류에 필요한 특성 맵(feature map)을 추출함으로써 시각 이미지 분석 성능을 향상시키기 위해 다수의 합성곱 층이 추가된다는 점이다. 그러나 제한된 처리 자원을 갖춘 엣지 컴퓨팅 모듈에서 저지연이 요구되는 응용을 실행하기 위해서는 알고리즘 최적화가 필요하다. 본 논문에서는 연속 미분 이미지(continuous differential images)를 활용하여 빠른 CNN을 위한 새로운 알고리즘 최적화 방법을 제안한다. 핵심 아이디어는 각 합성곱 층에서 입력의 미분 값(differential value)을 사용하여 연산을 변동적으로 감소시키는 것이다. 또한 제안 방법은 모든 유형의 CNN과 호환되며, 연속 이미지의 픽셀 값 차이가 낮을수록 성능이 더 우수하다. 우리는 DarkNet 프레임워크를 사용하여 클러스터링된 시스템에서 빠른 합성곱(fast convolution) 및 반(half) 합성곱(half convolution) 접근법으로 알고리즘을 평가하였다. 그 결과, 입력 프레임 속도가 10 fps일 때 FLOPs는 원래의 YOLOv7-tiny에 비해 약 4.92배 감소하였다. 합성곱 층의 FLOPs를 줄임으로써 추론 속도는 약 4.86 FPS로 향상되었으며, 이는 원래 YOLOv7-tiny에 비해 1.57배 더 빠른 속도이다. 반 합성곱 접근법을 위해 엣지 컴퓨팅 모듈 2개를 사용한 병렬 처리의 경우 FLOPs는 더 크게 감소하였고 응답 속도도 향상되었다. 더 나아가 확장 가능한 클러스터드 임베디드 시스템에서 최대 7개의 컴퓨트 모듈까지 사용자 원하는 만큼 추가로 확장함으로써, 더 빠른 객체 검출 구현이 가능하다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.