Cardinality estimation of approximate substring queries using deep learning | 심규석 교수 연구실 | 서울대학교 전기·정보공학부

|심규석 교수 연구실

홈

연구 영역

기본 정보

논문·특허

과제

구성원

Article|

인용수 12

·2022

Cardinality estimation of approximate substring queries using deep learning

Suyong Kwon, Woohwan Jung, Kyuseok Shim

IF 2.5 (2022) Proceedings of the VLDB Endowment

초록

근사 부분 문자열(approximate substring) 질의의 카디널리티(cardinality) 추정은 데이터베이스 시스템에서 중요한 문제이다. 기존의 접근은 텍스트 데이터로부터 요약(summary)을 구축하고, 일부 통계적 가정을 바탕으로 그 요약을 이용해 카디널리티를 추정한다. 딥러닝 모델은 복잡한 데이터 패턴을 효과적으로 학습할 수 있으므로, 데이터베이스 시스템에서의 질의 카디널리티 추정에 전통적 방법보다 우수한 성능을 보이며 성공적으로 적용되어 왔다. 그러나 아직 근사 부분 문자열 질의에는 적용되지 않았기 때문에, 우리는 이러한 질의의 카디널리티 추정을 위한 딥러닝 접근을 조사한다. 딥러닝 모델의 정확도는 학습 데이터 크기가 증가할수록 향상되는 경향이 있으나, 근사 부분 문자열 질의의 카디널리티 추정을 위해 대규모 학습 데이터를 생성하는 일은 계산적으로 비용이 많이 든다. 따라서 우리는 불필요한 계산을 피하고 공통 계산을 공유함으로써 효율적인 학습 데이터 생성 알고리즘을 개발한다. 또한 신속하게 정확한 딥러닝 기반 추정기를 얻기 위한 딥러닝 모델과 새로운 학습 방법을 제안한다. 광범위한 실험 결과, 제안한 학습 데이터 생성 알고리즘과 새로운 학습 방법을 포함한 딥러닝 모델이 우수함이 확인되었다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드

SubstringCardinality (data modeling)Computer scienceDeep learningArtificial intelligenceEstimatorComputationMachine learningAlgorithmTheoretical computer science

타입

Article

IF / 인용수

2.5 / 12

원문

https://doi.org/10.14778/3551793.3551859

게재 연도

2022