데이터 증강은 수년 동안 특히 제한적이고 불충분한 데이터가 있는 상황에서 모델 성능을 향상시키기 위해 컴퓨터 비전 분야에서 괄목할 만한 발전을 보여왔다. 현재 대부분의 연구는 객체 검출을 포함한 다양한 과제에서 학습 중 이미지 또는 그 특징을 조정하여 샘플의 크기, 품질 및 다양성을 확장하는 데 초점을 맞추고 있다. 그러나 우리는 특히 항공(항공 촬영) 영상에서는 바운딩 박스 주석이 일관되지 않을 수 있으므로, 이미지 수준의 변환이 아니라 데이터 증강 기법으로서 바운딩 박스 변환을 조사할 필요가 있다고 주장한다. 이에 본 투고 논문에서는 원격탐사 객체 검출을 위해 스케일링, 회전, 그리고 평행이동 측면에서 바운딩 박스 변환에 대한 철저한 분석을 제시한다. 우리는 이 증강 전략을 NBBOX(Noise Injection into Bounding Box)라고 명명한다. DOTA 및 DIOR-R에 대해 방대한 실험을 수행하였으며, 두 데이터셋 모두 항공 이미지에 존재하는 다양한 회전된 일반 객체를 포함하는 잘 알려진 데이터셋이다. 실험 결과, 우리의 접근법은 불필요한 과장이나 장식 없이 원격탐사 객체 검출 성능을 유의미하게 향상시키며, 다른 최신 증강 전략에 비해 시간 효율이 더 높음을 보인다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.