연구 영역
기본 정보
논문·특허
과제
구성원
Article|
인용수 2
·2022
Scalable Inference for Hybrid Bayesian Hidden Markov Model Using Gaussian Process Emission
Yohan Jung, Jinkyoo Park
IF 2.4 (2022) Journal of Computational and Graphical Statistics
초록

가우시안 과정(Gaussian Process, GP)을 방출(emission) 모델로 사용하는 은닉 마르코프 모델(Hidden Markov model, HMM)은 복잡한 형태의 연속(시계열) 데이터를 모델링하기 위해 널리 사용되어 왔다. 본 연구에서는 단일 채널에서 순차적으로 관측되는 각 시계열 관측치의 은닉 상태를 추정하기 위해, SM 커널(SM kernel)을 사용하는 GP 방출을 결합한 하이브리드 베이지안 HMM(HMM-GPSM)을 제안한다. 이어서, (1) 상태 전이를 위한 시퀀스의 수가 많고, (2) 각 은닉 상태에 대해 시계열 관측에서의 데이터 포인트 수가 많은, 대규모 시계열 데이터셋의 큰 시퀀스에 대해 HMM-GPSM을 학습하기 위한 확장 가능한 추론 방법을 제안한다. 상태 전이를 위한 시퀀스 수가 많은 경우에는 HMM-GPSM의 파라미터를 효율적으로 업데이트하기 위해 확률적 변분 추론(stochastic variational inference, SVI)을 사용한다. 또한, 데이터 포인트 수가 많은 각 시계열 관측에 대해서는 SM 커널의 스펙트럴 밀도(spectral density)에서 표본화한 스펙트럴 포인트를 사용하여 구성한 무작위 푸리에 특성(Random Fourier Feature, RFF)을 통해 근사 GP 방출을 제안한다. 아울러, 근사 GP 방출과 이에 대응하는 HMM-GPSM의 커널 하이퍼파라미터에 대한 효율적인 추론을 제안한다. 구체적으로, KL 발산(KL divergence)을 사용하여 GP 방출 가능도의 정규화된 하한(regularized lower bound)으로부터, 많은 수의 시계열 관측치에 대해 확장 가능하게 계산할 수 있는 HMM-GPSM의 학습 손실, 즉 증거 하한(evidence lower bound)을 도출한다. 제안된 방법들은 (1)과 (2)를 모두 포함하는 순차 시계열 데이터셋으로 HMM-GPSM을 학습하는 데 함께 활용될 수 있다. 제안 방법은 성능 지표로 군집화 정확도, 주변 가능도(marginal likelihood), 학습 시간을 사용하여 합성 및 실제 데이터셋에서 검증한다.

*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.

키워드
InferenceGaussian processComputer scienceBayesian inferenceBayesian probabilityHidden Markov modelScalabilityArtificial intelligenceMachine learningAlgorithm
타입
Article
IF / 인용수
2.4 / 2
게재 연도
2022