본 연구에서는 콘텐츠 기반 이미지 검색을 가속하기 위한 분산(in-memory) 기반 고차원 인덱싱 방법에 대해 3가지 k-최근접 이웃(k-NN) 최적화 기법을 제안한다. 제안된 기법들은 데이터 분포를 사용해 k-NN 최적화를 수행하는 밀도 기반 최적화 기법, 질의 처리 비용 통계를 활용하는 비용 기반 최적화 기법, 그리고 질의 로그를 기반으로 한 딥러닝 모델을 사용하는 학습 기반 최적화 기법으로서, 분산된 메모리 내 고차원 인덱싱을 통한 k-NN 질의 최적화를 수행한다. 제안 기법들은 대규모 분산 처리를 위한 master/slave 모델을 지원하는 Spark에 구현하였다. 또한 고차원 데이터에 기반하여 다양한 성능 평가를 통해 제안 기법들의 우수성과 타당성을 입증하였다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.