LIKE 술어 쿼리의 카디널리티 추정은 데이터베이스 시스템의 쿼리 최적화에서 중요한 역할을 한다. 전통적인 접근 방식은 일반적으로 텍스트 데이터의 요약과 몇 가지 통계적 가정에 의존한다. 최근에는 LIKE 술어 쿼리의 카디널리티 추정을 위한 딥러닝 모델이 연구되었다. 본 연구는 보다 정확한 카디널리티 추정과 최대 추정 오차의 감소를 위해, 확장 N-그램 테이블과 조건부 회귀 헤더(conditional regression header)를 활용하는 딥러닝 모델을 제안한다. 이어서 학습 데이터를 효율적으로 생성하는 방법을 조사한다. 우리의 LEADER (LikE predicate trAining Data gEneRation) 알고리즘은 LIKE 술어에 해당하는 관계형 쿼리들 간에 공유 가능한 결과를 활용한다. LIKE 술어에 해당하는 쿼리를 분석함으로써 효율적인 조인(join) 방법을 개발하고, 빠른 쿼리 실행과 공유 가능한 결과의 최대 공유를 위해 조인 순서를 활용한다. 실제 데이터셋을 대상으로 한 광범위한 실험은 제안된 학습 데이터 생성 알고리즘의 효율성과 제안된 모델의 효과를 확인한다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.