전자상거래의 확산은 웹 쇼핑 플랫폼을 방대한 디지털 시장을 탐색하는 고객에게 핵심 관문으로 만들었다. 그러나 이러한 빠른 성장은 소음이 많고 단편화된 정보 환경을 초래하여, 쇼핑객이 온라인에서 제품을 탐색하고 구매하는 과정에서 인지적 부담을 증가시키고 있다. 이 문제를 완화할 가능성이 유망함에도 불구하고, 에이전틱 시스템은 웹 쇼핑에서 사용자 측 작업을 자동화하기 위한 방안으로서 점차 주목을 받아 왔다. 그럼에도 불구하고, 기존 벤치마크는 개방형 웹 환경에서 에이전틱 시스템이 제품을 얼마나 잘 큐레이션할 수 있는지에 대해 포괄적으로 평가하지 못한다. 구체적으로, 이들은 쇼핑 시나리오의 범위를 제한적으로 다루며, 탐색적 검색보다는 단순화된 단일 플랫폼 조회에만 초점을 맞춘다. 또한 평가에서 개인화(personalization)를 간과하여, 에이전트가 현실적인 쇼핑 맥락에서 다양한 사용자 선호에 적응할 수 있는지 여부가 불명확하다. 이러한 공백을 해소하기 위해, 우리는 개방형 웹 환경에서 개인화된 제품 큐레이션을 수행하는 에이전틱 시스템을 평가하기 위한 최초의 벤치마크인 AgenticShop을 제시한다. 핵심적으로, 우리의 접근법은 현실적인 쇼핑 시나리오, 다양한 사용자 프로필, 그리고 검증 가능하며 체크리스트에 기반한 개인화 평가 프레임워크를 특징으로 한다. 광범위한 실험을 통해, 현재의 에이전틱 시스템은 전반적으로 충분하지 않음을 보여주며, 현대 웹 전반에서 맞춤형 제품을 효과적으로 큐레이션할 수 있는 사용자 측 시스템의 필요성을 강조한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.