보행자 추적은 시각 객체 추적 연구 분야에서 어려운 과제이며, 감시 시스템, 사람을 따라가는 로봇, 자율주행차와 같은 다양한 비전 기반 응용에서 핵심 구성 요소이다. 본 논문에서는 딥러닝과 거리(메트릭) 학습 기반 접근법을 결합하는 tracking-by-detection 패러다임을 통해 모든 비디오 프레임에서 각 사람의 개별 인스턴스를 식별하는 단일 보행자 추적(Single Pedestrian Tracking, SPT) 프레임워크를 제안한다. SPT 프레임워크는 검출(detection), 재식별(re-identification), 추적(tracking)이라는 세 가지 주요 모듈로 구성된다. 본 연구의 기여는 보행자 재식별 모듈에서 Siamese 아키텍처를 사용하는 두 개의 경량(metric learning 기반) 모델을 설계하고, 추적 모듈에서 보행자 검출기와 연관된 데이터에 대해 가장 견고한 재식별 모델 중 하나를 결합함으로써 결과를 유의미하게 향상시킨 데 있다. 우리는 비디오에서의 단일 보행자 추적에 대한 SPT 프레임워크의 성능을 평가하기 위해 여러 분석을 수행하였다. 재식별 모듈의 결과는 제안한 두 가지 재식별 모델이 대규모 데이터셋에서 정확도 79.2%와 83.9%, 소규모 데이터셋에서 92%와 96%로 기존 최첨단 모델을 능가함을 검증한다. 또한 제안된 SPT 추적기는 여섯 가지 최첨단(SOTA) 추적 모델과 함께 다양한 실내 및 실외 비디오 시퀀스에서 테스트되었다. 여섯 가지 주요 환경 요인을 고려한 정성적 분석은 조명 변화, 자세 변화로 인한 외형 변동, 목표 위치 변화, 부분 가림 상황에서 SPT 추적기의 효과성을 확인한다. 더불어 실험 결과에 기반한 정량적 분석은 제안된 SPT 추적기가 success rate 79.7%로 GOTURN, CSRT, KCF, SiamFC 추적기를 능가하는 한편, 평균 18 프레임/초의 추적 속도로 DiamSiamRPN, SiamFC, CSRT, GOTURN, SiamMask 추적기들을 제쳤음을 보여준다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.