요약 불완전한 데이터로부터 행동을 종합적으로 해석하는 일은 계산적 동물행동학(computational ethology)에서 근본적인 과제이다. 본 연구에서는 변환기(Transformer) 기반 추정 및 재구성을 위한 마스크드 오토인코더(Masked Autoencoder for Transformer-based Estimation and Reconstruction, MATER)를 제시한다. MATER는 전략적으로 마스킹된 신체 핵심점(body keypoints)을 재구성함으로써 라벨이 없는 설치류 포즈 데이터로부터 행동적으로 유의미한 표현을 추출하는 비지도(self-supervised) 학습 프레임워크이다. 이 접근법은 광범위한 수작업 주석을 요구하지 않으면서도 기본적인 움직임 패턴을 포착하며, 사회적 상호작용 중의 가림(occlusions)과 추적 오류(tracking errors) 등 흔한 실험상의 문제를 해결한다. 우리는 2차원 및 3차원 설치류 포즈 데이터셋 두 가지에서 MATER를 평가하였고, 핵심점 마스킹(keypoint masking) 수준이 높은 경우에도 강건함을 입증하였다. 이 프레임워크는 이러한 어려운 조건에서도 고충실도 재구성을 달성하며, 최소한의 감독만으로도 정확한 행동 분류를 지원하는 잠재 표현을 생성한다. 추가 분석을 통해 설치류의 움직임은 고유의 시공간(spatiotemporal) 구조를 보이며, 명시적인 라벨 없이도 이를 계산적으로 추론할 수 있음을 확인하였다. 재구성 성능은 움직임의 시간적 일관성(temporal coherence)과 밀접하게 연결되어 있어, 행동 표현에서 시간 동역학의 중요성을 강조한다. 이러한 결과는 동물의 행동이 계층적으로 조직되며 자연스러운 시간 의존성에 의해 지배된다는 새롭게 부상하는 관점을 재확인한다. MATER는 다양한 실험 맥락에서 복잡하고 자연스러운 행동을 분석하고자 하는 신경과학자들을 위한 견고하고 확장 가능한 도구를 제공함으로써, 행동 구조(behavioral architecture)와 그 신경적 기반에 대한 이해를 궁극적으로 진전시킬 것이다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.