최종무 교수 연구실
기본 정보
연구 분야
프로젝트
논문
구성원
article|
인용수 5
·2023
An Empirical Study of Segmented Linear Regression Search in LevelDB
Agung Rahmat Ramadhan, Minguk Choi, Yoojin Chung, Jongmoo Choi
IF 2.6 (2023) Electronics
초록

이 논문의 목적은 학습된 인덱스(learned index) 개념에 기반한 SLR(Segmented Linear Regression) 탐색이라는 새로운 탐색 메커니즘을 제안하는 것이다. 본 연구는 선행 연구에서 수집·활용된 대규모 데이터의 상당수가 선형성(linearity) 성질을 가진다는 관찰에 의해 동기를 얻었다. 즉, 키와 그에 저장된 위치가 강한 선형 상관관계를 보인다. 이러한 관찰은 주어진 키로부터 위치를 식별하기 위해 널리 알려진 머신러닝 알고리즘인 선형 회귀(linear regression)에 분할(segmentation)을 적용하는 방식으로 SLR 탐색을 설계하도록 이끌었다. 우리는 예측 정확도와 분할 오버헤드(segmentation overhead) 모두를 고려하여 두 가지 분할 기법, 즉 동일 크기(equal-size)와 오류 인지(error-aware) 기법을 고안하였다. 제안한 방법을 Google의 키-값 저장소인 LevelDB에 구현하고, 탐색 성능을 최대 12.7%까지 향상시킬 수 있음을 검증하였다. 또한 동일 크기 기법은 학습에서의 효율성을 제공하는 반면, 오류 인지 기법은 노이즈가 있는 데이터에 대해 허용 가능함을 확인하였다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
Computer scienceOverhead (engineering)Key (lock)SegmentationLinear regressionData miningRegressionArtificial intelligenceBig dataMachine learning
타입
article
IF / 인용수
2.6 / 5
게재 연도
2023

주식회사 디써클

대표 장재우,이윤구서울특별시 강남구 역삼로 169, 명우빌딩 2층 (TIPS타운 S2)대표 전화 0507-1312-6417이메일 info@rndcircle.io사업자등록번호 458-87-03380호스팅제공자 구글 클라우드 플랫폼(GCP)

© 2026 RnDcircle. All Rights Reserved.