분산 환경에서의 점진적인 학습을 위한 데이터 파이프라인

2023과학기술정보통신부개인기초연구(과기정통부)
프로젝트 소개
본 과제는 지속적으로 유입되는 대용량 데이터를 빠르게 모으고 처리해, 분산 학습과 점진적 모델 업데이트를 이어주는 데이터 파이프라인 구축 연구임. 연구 목표는 데이터 수집, 데이터 ingestion, 분산 학습, 점진적 모델 업데이트를 하나로 연결하는 구조를 만드는 데 있음. 이를 위해 분산 웹 크롤링 기반 수집과 중복제거 파이프라인, Kafka기반 ingestion 구조, 분산 프레임워크 기반 학습 모델, Edge computing에서의 전이 연합학습, Real World 벤치마크 정의 및 성능 평가를 수행함. 기대 효과는 자율주행, 사이버보안 감시센터, IoT 센서, SNS 등에서 복잡한 데이터 파이프라인을 쉽게 구축하고, 실시간 모델 업데이트를 가능하게 하는 데 있음.
분산 학습점진적 학습데이터 파이프라인데이터 수집데이터 ingestion연합학습성능 벤치마크Distributed learningIncremental learningData pipelineData collectionData ingestionFederated learningPerformance benchmark
참여형태
주관
사업명
개인기초연구(과기정통부)
부처명
과학기술정보통신부
주관기관명
서울과학기술대학
과제 수행연도
2023
과제 수행기간
2022.06.01 ~ 2025.02.28
과제 고유번호
1711187020
연구 개발단계
기초연구
연구비
총연구비
58,231,000
정부지원연구개발비
58,231,000
위탁연구비
0
민간연구비
0
주관/협동기관 정보
주관/협동수행기관명연구수행주체지역
주관서울과학기술대학대학서울특별시
과제 기반 국내외 특허0건
출원/등록 기관발명의 명칭출원일자출원국가출원번호등록일자등록번호
과제 기반 SCI(E) 논문0건
논문명학술지명DOI/URL