주요 논문
5
*2026년 기준 최근 6년 이내 논문에 한해 Impact Factor가 표기됩니다.
1
article
|
·
인용수 2
·
2024Differential Image-Based Scalable YOLOv7-Tiny Implementation for Clustered Embedded Systems
Sunghoon Hong, Daejin Park
IF 8.4 (2024)
IEEE Transactions on Intelligent Transportation Systems
강력한 시각 이미지 분석을 위한 합성곱 신경망(convolutional neural networks, CNNs)은 인공지능 분야에서 점차 인기를 얻고 있다. 다른 인공 신경망과 비교했을 때 CNN의 주요 차이점은 영상 분류에 필요한 특성 맵(feature map)을 추출함으로써 시각 이미지 분석 성능을 향상시키기 위해 다수의 합성곱 층이 추가된다는 점이다. 그러나 제한된 처리 자원을 갖춘 엣지 컴퓨팅 모듈에서 저지연이 요구되는 응용을 실행하기 위해서는 알고리즘 최적화가 필요하다. 본 논문에서는 연속 미분 이미지(continuous differential images)를 활용하여 빠른 CNN을 위한 새로운 알고리즘 최적화 방법을 제안한다. 핵심 아이디어는 각 합성곱 층에서 입력의 미분 값(differential value)을 사용하여 연산을 변동적으로 감소시키는 것이다. 또한 제안 방법은 모든 유형의 CNN과 호환되며, 연속 이미지의 픽셀 값 차이가 낮을수록 성능이 더 우수하다. 우리는 DarkNet 프레임워크를 사용하여 클러스터링된 시스템에서 빠른 합성곱(fast convolution) 및 반(half) 합성곱(half convolution) 접근법으로 알고리즘을 평가하였다. 그 결과, 입력 프레임 속도가 10 fps일 때 FLOPs는 원래의 YOLOv7-tiny에 비해 약 4.92배 감소하였다. 합성곱 층의 FLOPs를 줄임으로써 추론 속도는 약 4.86 FPS로 향상되었으며, 이는 원래 YOLOv7-tiny에 비해 1.57배 더 빠른 속도이다. 반 합성곱 접근법을 위해 엣지 컴퓨팅 모듈 2개를 사용한 병렬 처리의 경우 FLOPs는 더 크게 감소하였고 응답 속도도 향상되었다. 더 나아가 확장 가능한 클러스터드 임베디드 시스템에서 최대 7개의 컴퓨트 모듈까지 사용자 원하는 만큼 추가로 확장함으로써, 더 빠른 객체 검출 구현이 가능하다.
https://doi.org/10.1109/tits.2024.3419095
Computer science
Scalability
Artificial intelligence
Embedded system
Computer vision
Operating system
2
article
|
인용수 20
·
2022Digital-Twin Consistency Checking Based on Observed Timed Events With Unobservable Transitions in Smart Manufacturing
Moon Gi Seok, Wen Jun Tan, Wentong Cai, Daejin Park
IF 12.3 (2022)
IEEE Transactions on Industrial Informatics
스마트 공장은 다양한 what-if 생산 시나리오의 성능을 평가하기 위해 디지털 트윈(DT)을 관리한다. 본 논문은 물리적 제조 공장에서 감지되는 각 시간 제한 사건이 실시간에서 해당 DT 기반 추정치 아래에 있는지를 점검함으로써, DT를 높은 충실도로 유지하기 위한 DT 일관성 검증 접근법을 제시한다. 본 접근법은 시간 색칠 페트리 넷(time colored Petri net, TCPN)을 사용하여 개발된 DT를 대상으로 한다. 관측 가능한 시간적 여유를 포함한 다음 관측 가능 사건의 후보를 구성하기 위해, 새 주문에 의해 유발되는 잦은 외부 작동, 기계 유지보수 등과 같은 공장의 확률적 특성뿐 아니라, 감지 가능한 사건에 도달하는 중간의 관측 불가능 상태 전이도 고려하였다. 이러한 고려를 바탕으로, 효율적으로 진화된 상태-클래스 그래프(state-class graph, SCG)를 사용하여 스트리밍되는 물리적 사건에 대한 가상 추정치를 구축하는 반복적 방법을 제안한다. 또한 SCG 진화를 가속하고, 진단되는 비일관 서브넷의 분리를 지원함으로써 DT 유지보수를 보다 용이하게 하는 TCPN 분할 방법도 제안한다. 본 접근법을 USB 플래시 드라이브 공장에 적용하여 개념을 입증하였으며, 추정의 핵심 오버헤드인 SCG 진화의 속도 향상을 다양한 상황에서 평가하였다.
https://doi.org/10.1109/tii.2022.3200598
Unobservable
Computer science
Overhead (engineering)
Consistency (knowledge bases)
Distributed computing
Event (particle physics)
Real-time computing
Asynchronous communication
State (computer science)
Petri net
3
article
|
인용수 4
·
2022Runtime ML-DL Hybrid Inference Platform Based on Multiplexing Adaptive Space-Time Resolution for Fast Car Incident Prevention in Low-Power Embedded Systems
Sung‐Hoon Hong, Daejin Park
IF 3.9 (2022)
Sensors
전방 차량 탐지는 전방에서 발생하는 자동차 사고를 예방하는 핵심 기술이다. 인공지능(AI) 기법은 차량을 보다 정확하게 탐지하는 데 활용되지만, AI 기반 차량 탐지는 높은 계산 복잡도로 인해 많은 처리 시간이 소요된다. 전방 차량과의 충돌 위험이 있을 때, 차량의 느린 탐지 속도는 사고로 이어질 수 있다. 실시간으로 차량을 신속하게 탐지하기 위해서는, 기존 AI 기반 차량 탐지와 유사한 탐지 성능을 가지면서도 고속이며 경량인 차량 탐지 기술이 필요하다. 또한 차량에 전방 충돌 경고 시스템(FCWS) 기술을 적용하기 위해서는, 차량의 배터리 소모가 낮게 유지되어야 하므로 저전력 임베디드 시스템 기반의 고성능을 제공하는 것이 중요하다. 차량 탐지 알고리즘은 FCWS에서 가장 많은 자원을 차지한다. 전력 소모를 줄이기 위해서는, 즉 알고리즘을 실행하는 데 필요한 자원의 양을 줄이기 위해 알고리즘의 계산 복잡도를 감소시키는 것이 중요하다. 본 논문은 머신러닝과 딥러닝을 이용한 빠르고 정확한 전방 차량 탐지 방법을 제시한다. 연속된 영상에서 차량을 일관되게 탐지하기 위해, 추적 알고리즘을 기반으로 경계 상자를 예측하고 탐지 알고리즘을 기반으로 이를 보정하기 위해 칼만 필터를 사용한다. 그 결과, 딥러닝 기반 객체 탐지에 비해 차량 탐지 속도가 약 25.85배 더 빠르며, 탐지 정확도는 머신러닝 기반 객체 탐지보다 우수하다.
https://doi.org/10.3390/s22082998
Computer science
Object detection
Real-time computing
Vehicle tracking system
Collision detection
Artificial intelligence
Kalman filter
Deep learning
Minimum bounding box
Collision
4
article
|
인용수 8
·
2022FPGA Realization of the Observer-Based Sliding Discrete Fourier Transform
Peter Plesznik, Zsolt Kollár, Daejin Park
IF 3.9 (2022)
IEEE Access
이산 푸리에 변환(Discrete Fourier transform, DFT)은 디지털 신호 처리에서 신호 분석에 널리 사용되는 방법이다. DFT는 신호를 시간 영역에서 주파수 영역으로 변환하여 추가 처리를 가능하게 한다. DFT의 고정 크기 슬라이딩 윈도우 응용에서 관측자 기반 슬라이딩 DFT(observer-based sliding DFT, oSDFT) 알고리즘은 잘 알려진 블록 지향 고속 푸리에 변환(block-oriented fast Fourier transforms, FFT)보다 안정적이며 정확하고 이론적으로 더 빠른 것으로 입증되어 왔다. 그러나 oSDFT에 대한 하드웨어 구현은 아직 제안되지 않았다. 본 논문에서는 FPGA를 위한 알고리즘의 두 가지 변형에 대해 하드웨어 최적화된 구현을 제시한다. 이러한 구현은 처리 속도와 하드웨어 요구 사항 측면에서 Xilinx FFT 지적 재산권(Intellectual Property)과 비교된다. Vivado IDE를 사용하여 Verilog HDL로 구조를 구현하였으며, 처리 속도를 최대화하고 필요한 하드웨어 자원을 최소화하는 것을 목표로 한다. 샘플 단위 처리 시나리오에서 FPGA 기반 oSDFT 및 FFT 회로를 분석한 결과, oSDFT의 지연과 에너지 사용량은 FFT에 비해 더 작았다. 구현된 구조에서 처리되는 샘플당 지연과 에너지 사용량은 각각 FFT에 비해 최대 9배 및 10배까지 낮다. 또한 이러한 방법에 필요한 자원과 그에 대한 분석도 제시한다.
https://doi.org/10.1109/access.2022.3153050
Fast Fourier transform
Computer science
Field-programmable gate array
Signal processing
Digital signal processing
Discrete Fourier transform (general)
Computer hardware
Verilog
Latency (audio)
Algorithm
5
article
|
인용수 10
·
2022Efficient Object Detection Based on Masking Semantic Segmentation Region for Lightweight Embedded Processors
Heuijee Yun, Daejin Park
IF 3.9 (2022)
Sensors
카메라를 이용한 영상처리 기술의 발전과 이후 인공지능 기술의 발달로 다양한 분야에서의 적용이 시작되었다. 그러나 경량 보드에서 많은 계산을 요구하는 영상처리 알고리즘을 구현하기는 어렵다. 본 논문은 경량 임베디드 보드에서 실시간 딥러닝 객체 인식 알고리즘을 사용하는 방법을 제안한다. 두 가지 딥 신경망 아키텍처를 적절히 활용하여 경량 임베디드 보드에 적합한 알고리즘을 개발하였다. 첫 번째 아키텍처는 계산량이 적은 대신 정확도가 낮다. 두 번째 아키텍처는 계산량이 크지만 정확도가 높다. 상대적으로 적은 계산으로 의미론적 분할(semantic segmentation)을 수행하는 첫 번째 아키텍처로 영역을 결정한다. 이후 더 정확한 딥러닝 아키텍처로 영역을 마스킹한 뒤, 분할에 의해 이미지를 필터링하고 배경과의 구분(background separation) 등 다양한 변수에 의해 인식되지 않은 경우를 제외함으로써 객체 탐지를 수행하며 정확도를 향상시킨다. 입력 영상 처리를 위해 Python에서 OpenCV(Open source Computer Vision)를 사용하였고, 효율적인 신경망(ENet)과 You Only Look Once(YOLO)를 이용하여 영상을 처리하였다. 이 알고리즘을 실행한 결과, 평균 오차를 약 2.4배까지 감소시켜 보다 정확한 객체 탐지가 가능하였다. 또한 약 4 FPS(frames per second)의 처리 속도를 달성함으로써 경량 임베디드 보드에서도 객체 인식을 실시간으로 수행할 수 있었다.
https://doi.org/10.3390/s22228890
Computer science
Artificial intelligence
Python (programming language)
Segmentation
Object detection
Computer vision
Artificial neural network
Image processing
Image segmentation
Deep learning