데이터베이스 질의 처리 및 카디널리티 추정 연구

Database Query Processing and Cardinality Estimation

연구 내용

데이터베이스 질의에 대한 카디널리티를 빠르고 정확히 추정하는 딥러닝 기반 연구

근사 substring 질의의 카디널리티 추정은 요약 정보에 기반한 통계 가정이 성능을 좌우합니다. 본 연구는 deep learning 기반 estimator를 사용해 텍스트 요약이 갖는 가정의 한계를 완화하고, 학습 데이터 생성을 대규모 반복 연산 없이 효율화하는 절차를 함께 제공합니다. 공통 계산을 공유하고 불필요한 생성을 회피하여 학습 비용을 줄이면서도 모델이 질의 분포를 학습하도록 학습 방법을 설계합니다. 그 결과 데이터베이스 질의 최적화 및 검색·분석 파이프라인에서 요구되는 추정 정확도와 계산 효율을 동시에 달성하는 방향을 목표로 합니다.

관련 프로젝트

0건

연구 흐름

초기 단계에서는 근사 substring 질의에 대해 전통적 요약 기반 추정이 갖는 구조적 한계를 정리하고, 이를 대체할 deep learning estimator의 적용 가능성을 검토했습니다. 이후 정확도를 유지하기 위해 학습 데이터 규모를 과도하게 키우지 않는 생성 알고리즘을 도입하고, 중복 연산을 줄이는 방식으로 학습 비용을 관리하는 흐름을 확보했습니다. 마지막으로 단기간에 정확한 추정값을 얻기 위한 학습 전략을 제안하고, 다양한 질의 설정에서 estimator의 성능을 검증하는 방향으로 연구를 수행했습니다.

활용 가능성

활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.

질의 최적화 비용 추정
근사 텍스트 질의 선택도 추정
DB 기반 검색 정확도 개선
대규모 로그 기반 질의 계획
효율형 카디널리티 추정 모듈
데이터 요약 대체 추정기
쿼리 실행 계획 안정화
검색엔진 순위 후보 축소
텍스트 마이닝 파이프라인 최적화
DB 기능 확장형 학습 모듈