교차 카메라 Persson 연관의 목적은 분리된 서로 다른 카메라에 포착된 개인을 식별하는 것이다. 이는 시각 입력으로부터 고유한 신원 표현을 추출하는 재식별(Re-Identification, ReID) 모델에 의해 달성되며, 비디오 시퀀스가 지배적인 입력이다. 대부분의 ReID 방법은 주로 사람을 더 잘 나타내는 특징을 학습하기 위해 백본 네트워크 아키텍처를 수정하는 데 초점을 맞춘다. 그러나 이러한 방법들은 학습 과정에서 저품질 프레임이 미치는 영향을 종종 간과한다. 여러 연구는 저품질 데이터가 모델이 의미 있는 내용을 학습하는 것을 방해할 뿐 아니라 성능을 저하시킨다는 점을 확인하였다. 가능한 해결책 중 하나는 각 프레임의 품질을 수동으로 라벨링하는 것이지만, 이는 시간이 많이 들고 비효율적이다. 본 논문에서는 이러한 문제를 해결하기 위해 고품질 프레임을 자동으로 선택하기 위해 비지도 클러스터링을 적용하는 비지도 프레임 클러스터링 및 선택 프레임워크인 UFCS를 제안한다. 구체적으로, 고품질 프레임 선택을 위해 K-means, Deep K-means, DBSCAN의 세 가지 비지도 클러스터링 해법을 적용하였다. 이러한 클러스터링 기법은 트랙릿(tracklets) 내에서 동작함으로써 외관뿐만 아니라 간접적으로 시간적 일관성을 통합한다. 이들 방식은 영상 또는 딥 특징 공간에서 클러스터링을 수행하여 네트워크 학습을 위한 고품질 프레임을 선택한다. 이와 같이 단순하면서도 효과적인 접근은 ReID 네트워크가 더 구별력 있는 표현을 생성할 수 있게 하여, 인식 성능을 향상시킨다. 난이도가 높은 비디오 기반 사람 ReID 데이터셋 MARS에서 얻은 실험 결과는, 제안한 기법이 관련 최신 기술 대비 큰 폭으로 우수함을 보여준다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.