RnDcircle

분산 환경에서의 점진적인 학습을 위한 데이터 파이프라인

2023과학기술정보통신부개인기초연구(과기정통부)

프로젝트 소개

본 과제는 지속적으로 유입되는 대용량 데이터를 빠르게 모으고 처리해, 분산 학습과 점진적 모델 업데이트를 이어주는 데이터 파이프라인 구축 연구임. 연구 목표는 데이터 수집, 데이터 ingestion, 분산 학습, 점진적 모델 업데이트를 하나로 연결하는 구조를 만드는 데 있음. 이를 위해 분산 웹 크롤링 기반 수집과 중복제거 파이프라인, Kafka기반 ingestion 구조, 분산 프레임워크 기반 학습 모델, Edge computing에서의 전이 연합학습, Real World 벤치마크 정의 및 성능 평가를 수행함. 기대 효과는 자율주행, 사이버보안 감시센터, IoT 센서, SNS 등에서 복잡한 데이터 파이프라인을 쉽게 구축하고, 실시간 모델 업데이트를 가능하게 하는 데 있음.

분산 학습점진적 학습데이터 파이프라인데이터 수집데이터 ingestion연합학습성능 벤치마크Distributed learningIncremental learningData pipelineData collectionData ingestionFederated learningPerformance benchmark

참여형태

주관

사업명

개인기초연구(과기정통부)

부처명

과학기술정보통신부

주관기관명

서울과학기술대학

과제 수행연도

2023

과제 수행기간

2022.06.01 ~ 2025.02.28

과제 고유번호

1711187020

연구 개발단계

기초연구

연구비

총연구비

58,231,000 원

정부지원연구개발비

58,231,000 원

위탁연구비

0 원

민간연구비

0 원

주관/협동기관 정보

주관/협동	수행기관명	연구수행주체	지역
주관	서울과학기술대학	대학	서울특별시

과제 기반 국내외 특허0건

출원/등록 기관	발명의 명칭	출원일자	출원국가	출원번호	등록일자	등록번호

과제 기반 SCI(E) 논문0건

논문명	학술지명	DOI/URL