프로젝트 소개
본 과제는 모바일·웹 기반 상권 데이터에서 매장과 이용자 흐름을 더 똑똑하게 찾기 위한 공간데이터 분석 기술 연구임.
연구 목표는 “Spark에서 상권분석을 위한 방향 및 지능적 키워드 검색 기반 클러스터링 기법 개발”이며, 정형 데이터에 더해 비정형 텍스트(키워드 집합)와 객체의 방향성까지 반영한 데이터마이닝 빅데이터 처리 기술 개발을 수행함. 핵심 내용은 상권 도메인 한국어 웹 크롤러 기반 학습데이터 구축, 특화 워드 임베딩 모델 생성, Spark에서 방향 기반 논리적 공간 데이터 파티셔닝 및 키워드 기반 랜덤 파티셔닝, 파티션 요약정보 생성과 글로벌 군집 병합 형성 알고리즘 및 테스트 베드 성능평가 수행임. 기대 효과는 방향·키워드 기반 분산/병행 클러스터링 기술의 선도와 실시간 상권분석 IT 산업 성장 동력 창출임.