본 연구 기술은 점진적이면서 지속적으로 생성되는 데이터에 대해 반복적으로 데이터베이스를 스캔하고 마이닝하는 한계를 극복하기 위해 데이터를 한번 스캔으로 저장 후 추후 새로운 데이터가 점진적으로 입력되거나 삽입, 삭제, 수정에 대한 마이닝 요청이 올 경우 성능에 가장 큰 영향을 주는 대용량의 데이터를 다시 스캔하는 것을 최소화하기 위해 데이터의 특성을 분석하고 가능한 기존에 쌓여진 데이터를 재 스캔을 최소한으로 하는 프리라아지 기반의 최신 데이터 스트림의 특성을 반영하는 새로운 저장 구조를 개발함. 또한, 기존의 방법과 차별화되는 프리라아지 기법에 적합한 패턴 프루닝 기법 및 마이닝 기술, 스트림 데이터 처리의 효율성을 극대화하면서 사용자가 실제로 원하는 가장 유용한 결과를 추출하기 위한 탑케이 프리라아지 스트림 중요 패턴 마이닝 기술 등의 연구 및 기술을 개발함.
본 연구 기술은 점진적이면서 지속적으로 생성되는 데이터에 대해 반복적으로 데이터베이스를 스캔하고 마이닝하는 한계를 극복하기 위해 데이터를 한번 스캔으로 저장 후 추후 새로운 데이터가 점진적으로 입력되거나 삽입, 삭제, 수정에 대한 마이닝 요청이 올 경우 성능에 가장 큰 영향을 주는 대용량의 데이터를 다시 스캔하는 것을 최소화하기 위해 데이터의 특성을 분석하고 가능한 기존에 쌓여진 데이터를 재 스캔을 최소한으로 하는 프리라아지 기반의 최신 데이터 스트림의 특성을 반영하는 새로운 저장 구조를 개발함. 또한, 기존의 방법과 차별화되는 프리라아지 기법에 적합한 패턴 프루닝 기법 및 마이닝 기술, 스트림 데이터 처리의 효율성을 극대화하면서 사용자가 실제로 원하는 가장 유용한 결과를 추출하기 위한 탑케이 프리라아지 스트림 중요 패턴 마이닝 기술 등의 연구 및 기술을 개발함.
본 과제는 데이터가 실시간으로 계속 늘어나는 환경에서 스트림 데이터 처리와 스트림 마이닝을 빠르고 적은 리소스로 수행하는 기법 개발 연구임.
연구 목표는 적은 리소스로 좋은 성능을 내는 기술 개발 및 개선이며, 핵심 연구 내용은 1차년도 실시간 스트림 저장구조 개선, 스트림 마이닝 특성 기반 데이터 탐색, 실시간 프루닝, 성능 평가임. 2차년도는 인크리멘탈 스트림 마이닝, 시간의 흐름 반영, 최신 중요도 중심 기법 개선 및 성능 평가임. 기대 효과는 네트워크·마켓·제조·상품 데이터 등 다양한 응용에서 실시간 처리와 중요 패턴 추출로 유용한 지식 제공 가능함.
본 과제는 시간에 따라 계속 쌓이는 데이터를 대상으로, 실시간 이레이저블 패턴 마이닝을 수행하는 기술을 개발해 불필요 정보는 줄이고 의미 있는 패턴을 찾는 연구임.
연구 목표는 1차년도 저장구조 및 탐색기술, 2차년도 점진적 특성 기반 데이터 전처리·변환과 사전 패턴 프루닝, 인크리멘탈 마이닝, 3차년도 시간 흐름(감쇄 요소) 반영 기술의 통합과 성능 평가임. 기대효과는 효율적 실시간 분석 기반의 국내 기술 국산화, 새로운 저장구조·마이닝·패턴 프루닝 지식재산권 확보, 빅데이터 필터링 및 저이윤 상품·위기 대응 등 경제·산업 분야 적용 가능함.
본 과제는 비정형 빅데이터에서 실시간 동향을 뽑아내는 분석 기술을 개발하는 연구임. 2차년도에서는 1차년도 기술을 바탕으로 데이터 마이닝으로 그룹별 특성 패턴을 찾고, 실시간 입력 데이터를 그룹 분석으로 반영하는 기술을 구축함.
연구 목표는 그룹별 특성 패턴 분석, 그룹 예측, 크기가 변화하는 윈도우 기반 최신 데이터 실시간 반영, 새로운 사용자 데이터 실시간 반영, 특성 패턴을 통한 동향 분석 기술 및 최종 통합·검증 수행에 있음. 연구 내용은 클러스터링, 상관관계 분석, 패턴 마이닝 등을 접목해 동향 분석 시스템을 개발하는 과정으로 구성됨. 기대 효과는 실시간 동향 분석 원천기술 확보와 참여기업 매출 증대 및 기술 경쟁력 함양에 있음.