연구 영역
기본 정보
논문·특허
과제
구성원
Article|
인용수 2
·2025
WQuatNet: Wide range quaternion-based head pose estimation
Redhwan Algabri, Hyunsoo Shin, Ahmed Abdu, Ji‐Hun Bae, Sungon Lee
IF 6.1 (2025) Journal of King Saud University - Computer and Information Sciences
초록

머리 자세 추정(head pose estimation, HPE)은 인간-컴퓨터 상호작용, 의료, 로보틱스, 감시 등 다양한 응용 분야에서 핵심적인 과제이다. 기존의 대부분 방법은 오일러 각(Euler angles)을 표현으로 사용하지만, 특히 360° 전 범위 회전 상황이나 9개의 매개변수가 필요한 회전 행렬에서는 짐벌 락(gimbal lock)과 같은 어려움에 직면하는 경우가 많다. 본 연구는 이러한 문제를 회피하기 위해 4개의 매개변수만 사용하는 쿼터니언(quaternion) 표현을 활용하는 새로운 딥러닝 기반 모델인 WQuatNet을 제안한다. WQuatNet은 랜드마크-프리(landmark-free) HPE 방법에 기반하여, 이미지를 통해 360 의 전 범위 각도에서 머리 자세를 예측하도록 설계되었다. 랜드마크-프리 방법은 얼굴 랜드마크의 명시적 검출이 필요하지 않으며, 대신 전체 이미지를 활용해 머리의 방향을 추정한다. 본 모델은 견고한 특징 추출을 위해 RepVGG-D2se 백본을 통합하고, 쿼터니언 예측을 위한 두 가지 손실 함수(loss function)를 도입한다. 여러 HPE 데이터셋에서 협소-각도(narrow-range)와 전범위(full-range) 각도를 모두 포함하여 수행한 실험 결과는 WQuatNet이 정확도 측면에서 최신 기술 수준(SOTA) 접근법보다 우수함을 보여준다. 제안된 HPE의 성능은 CMU, AGORA, BIWI, AFLW2000, 300W-LP 데이터셋을 사용하여 평가하였다. 또한 각 모델 구성 요소의 중요성을 검증하기 위해 절제(ablation) 실험과 오류 분석을 수행하였다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
QuaternionHead (geology)PoseRange (aeronautics)Artificial intelligenceComputer scienceComputer visionMathematicsEngineeringGeology
타입
Article
IF / 인용수
6.1 / 2
게재 연도
2025