GPU-Accelerated Query Execution and Schema-Driven Retrieval (JSON/KG)
연구 내용
GPU 질의 실행의 부하 불균형을 완화하고 JSON·지식그래프 스키마를 활용해 검색을 안정화하는 연구
관계형 질의 실행에서 operator별 출력량 변동으로 발생하는 워프 단위 부하 불균형을 줄이는 GPU-가속 질의 엔진을 개발합니다. 입력 튜플을 균등 분할하는 단순 방식의 한계를 intra-warp와 inter-warp load imbalance로 분류하고, warp 내에서는 입력 보유 조건을 맞춘 뒤 연산을 수행하도록 재구성합니다. 워프 간 부하는 heavy workload를 근사 추정하여 idle warp로의 재분배 임계값을 적응적으로 조정함으로써 완화합니다. 또한 JSON 문서 집합에서 top-down 가정과 달리 bottom-up으로 스키마를 구성하고 MDL 원리를 이용해 후보 스키마를 선택합니다. LLM 기반 지식그래프 질의에서는 schema graph를 활용해 pseudo query graph를 정제하고 approximate distance join으로 KG 검색을 효율화하며, 환각 리스크를 줄이는 방향의 검색 프레임워크를 제안합니다.
관련 연구 성과
관련 논문
3편
관련 특허
1건
관련 프로젝트
5건
연구 흐름
관계형 질의 실행의 GPU 병렬화에서 발생하는 부하 불균형을 관찰하고, 워프 내부(intra)와 워프 간(inter) 원인을 분리해 해결하는 엔진 설계를 수행했습니다. 이후 semi-structured 데이터 측면에서는 JSON schema discovery를 기존 top-down 가정의 한계에서 출발해 bottom-up 구성으로 전환하고, MDL 기반 모델 선택으로 스키마 일반화와 정확도를 동시에 맞추는 방향으로 연구를 확장했습니다. 동시에 LLM-지식그래프 결합에서 검색이 흔들리는 문제를 줄이기 위해 schema graph를 이용한 pseudo query 정제와 approximate distance join 기반 검색으로 연결되는 프레임워크를 제안했습니다. 2024~2025년 성과를 통해 실행 엔진과 검색·스키마 추론을 같은 질의 처리 관점에서 통합하는 흐름을 보였습니다.
활용 가능성
활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.
관련 논문
구분
제목
Themis: A GPU-Accelerated Relational Query Execution Engine
ReCG: Bottom-up JSON Schema Discovery Using a Repetitive Cluster-and-Generalize Framework
SAFE: Schema-Driven Approximate Distance Join for Efficient Knowledge Graph Querying
관련 특허
구분
제목
GPU 기반 질의 처리 가속 방법 및 컴퓨팅 시스템
관련 프로젝트
구분
제목
멀티모달 데이터에 대한 분석 및 추론을 지원하는 AI 데이터베이스 시스템 개발
AI Guardians: 강건하고 통제가능하며 편향 없는 신뢰 AI 기술 개발
AI Guardians: 강건하고 통제가능하며 편향 없는 신뢰 AI 기술 개발
초거대 AI 모델의 장기 기억 저장을 위한 벡터 DB 개발
초거대 AI 모델의 장기 기억 저장을 위한 벡터 DB 개발