네트워크는 자료의 복잡성으로 인하여 주로 어느 하나의 시점에 관찰한 자료를 중심으로 많은 연구가 이루어졌고, 시계열 네트워크에 대한 연구는 다소 제한적으로 이루어졌다. 본 연구과제에서는 잠재공간 모형화를 통하여 통계적인 관점에서 네트워크의 선호적 연결, 링크 지속성, 군집화라는 세 가지 구조적 변화에 대한 이론적 성질을 규명하고, 이러한 구조적 변화가 나타...
네트워크분석
시계열분석
잠재공간모델
하이퍼그래프
소셜네트워크
3
주관|
2021년 8월-2024년 2월
|31,392,000원
부익부 빈익빈과 노드 적합성의 일반화된 네트워크 성장에 미치는 영향 연구
노드의 인기도(popularity)는 네트워크 구성원들 사이에서 유명하거나 인기 있는 정도를 의미한다. 기존 네트워크에서는 차수 중심성, 매개 중심성, 근접 중심성, 아이겐벡터 중심성 등을 인기의 척도로 많이 사용하였다. 여러 개의 노드 사이의 관계가 중요한 하이퍼그래프나 단체복합체 등에서는 앞에서 말한 척도들을 확장하여 사용하여야 한다. 또한, 확장 네트워크 구조의 특성과 데이터의 특성에 맞추어 알맞은 인기의 척도를 개발한다.
노드 적합성(fitness)은 엣지 형성에 관여하는 능력으로 해석할 수 있다. 데이터의 특성에 따라 노드 적합성이 시간에 따라 변화하는 것을 허용하거나 허용하지 않을 수 있다. 이는 데이터의 배경에 따라 판단하거나, 시간에 따라 변화하는 것을 허용한 모형으로 추론 후 가설 검정을 통한 방법으로 판단할 수 있다. 예를 들어, 초기 능력치는 표준정규분포를 따르고 변화는 랜덤 워크를 가정하거나 ARMA 등의 시계열 모형을 적용할 수 있다.
기존의 네트워크 모형을 다항 관계를 나타내기에 적합한 하이퍼그래프 모형과 단체복합체 모형으로 확장한다. 하이퍼그래프 모형을 정의하기 전에 각 노드의 인기도와 적합성을 고려하여 종합적인 스코어를 정의하고 이를 모형에 활용한다. 또한, 하이퍼엣지 사이즈를 고려하여 모형에 반영한다. 하이퍼그래프와 단체복합체의 형태를 고려하여 모형을 설정한다.
합성 수치가 높은 노드는 시간이 지날수록 더 유명해질 가능성이 높고 적합성과 인기도 사이의 강한 양의 상관관계를 야기한다. 이를 다루기 위해 인기 값을 주어진 값으로 간주하는 것이 아니라, 능력치에 영향을 받는다고 가정하여 분포를 고려하거나, 상호작용 변수를 둘 수 있음을 참고하여 연구를 진행할 것이다.
추정 방법으로 EM 알고리즘과 베이지안 추론 방법을 이용할 수 있다. 과정을 간단히 요약해 보면, 베이지안 추론 방법을 이용하여 노드 적합성을 추정하고, EM 알고리즘을 이용하여 파라미터들을 추정한다. 이 과정에서 깁스 샘플링 방법이 이용될 수 있다. 하지만, 베이지안 방법은 연산속도가 느릴 가능성이 높기에, 이를 보완할 수 있는 빠른 대용량 알고리즘을 개발하는 것이 주요 목표 중 하나이다.