Data-centric Vector Representation of Lactation Curves for Machine Learning
연구 내용
젖산 곡선을 piecewise linear regression 기반 벡터로 표현하고 잔차와 분절 수를 제어하여 데이터 중심 기계학습 입력으로 활용 가능한 LC 표현을 개발하는 연구
젖산 곡선(Lactation Curve, LC)은 개체별 시간에 따른 변화가 누적되는 시계열 데이터입니다. 본 연구는 곡선을 분절 선형(piecewise linear) 구조로 근사하여 연속 구간의 연결 형태를 보존하는 데이터 중심 표현을 구성합니다. 급격한 전이 구간을 기준으로 핵심 분절 지점을 산정하고, 잔차의 최대값으로 연결 선분의 위치와 개수를 결정합니다. Bayesian information criterion을 활용해 과적합을 완화하면서 기계학습 입력으로 직접 사용 가능한 벡터 기술을 확보합니다. 또한 군집 기반 특성화로 전형 패턴과 비전형 패턴을 구분해 분석 파이프라인을 정교화합니다.
관련 연구 성과
관련 논문
2편
관련 특허
0건
관련 프로젝트
0건
연구 흐름
초기에는 2020년 연구에서 LC를 K-medoids 기반으로 군집화하고 전형 패턴과 비전형 패턴의 예측 오차 양상을 비교하는 방식으로 곡선 특성의 구조를 규명했습니다. 이후 2022년 연구에서는 비전형 패턴까지 포함하되 데이터 기반 모델에 바로 투입 가능한 LC 기술자를 만들기 위해 piecewise linear regression 기반 벡터 표현을 제안했습니다. 급격 전이 지점을 기준으로 분절 구조를 결정하고, Bayesian information criterion으로 분절 수를 조절하여 과적합을 완화하는 방향으로 발전했습니다. 최근에는 이러한 표현과 특성화 결과를 결합해 입력 품질을 개선하는 연구 흐름을 유지하고 있습니다.
활용 가능성
활용 가능성은 알앤디써클 특화 AI 에이전트가 생성한 내용으로, 실제 연구 가능 여부는 연구실과의 논의가 필요합니다.
관련 논문
구분
제목
Clustering and Characterization of the Lactation Curves of Dairy Cows Using K-Medoids Clustering Algorithm
A Vector Representation of Lactation Curves for Dairy Cows