그래프 신경망(Graph Neural Networks, GNN)은 일반적으로 그래프 구조에서의 상호작용을 포착하기 위해 노드 속성이 존재한다고 가정한다. 그러나 실제 그래프 데이터는 종종 불완전하거나 완전히 누락된 속성 정보를 갖는다. 불완전한 속성을 다루기 위한 GNN 접근법은 널리 구현되어 있으나, 속성이 없는 그래프에 대한 연구는 부족한 실정이다. DeepWalk 및 node2vec은 그래프 합성곱 신경망(Graph Convolutional Networks, GCN)에서 인공적인 속성을 생성하는 데 활용될 수 있다. 하지만 무작위 보행의 확률적 특성은 일관되지 않은 성능을 초래한다. 또한 이는 차수 편향(degree bias)을 도입하여 허브 노드가 과도하게 샘플링되고, 저차수 노드는 과소 표현되는 문제를 유발한다. 이러한 한계를 해결하기 위해 우리는 인공 노드 속성 생성을 위한 Walk Graph Convolutional Networks (WalkGCN)를 제안한다. WalkGCN은 노드 시퀀스 생성 과정에서 차수에 의한 편향을 완화하는 편향 샘플링 전략을 사용한다. 학습 데이터의 균형을 맞추기 위해 리프 노드(leaf nodes)의 샘플링 빈도를 증가시킨다. 선행 단계에서 생성된 노드 임베딩(node embeddings)을 각 노드의 인공 속성으로 활용한다. 이후 인공 속성을 포함한 그래프를 표준(vanilla) 그래프 합성곱 신경망 모델에 입력하여 노드 분류를 수행한다. 세 개의 그래프 데이터셋에 대해 광범위하게 수행한 실험 결과는 WalkGCN이 무작위 보행의 하이퍼파라미터 또는 무작위성(randomness)과 무관한 인공 속성을 효과적으로 생성함을 보여준다. 또한 제안된 모델은 다양한 기준(baseline) 모델보다 성능이 우수하다. 코드는 https://github.com/mincheol-shin-cau/WalkGCN 에서 제공된다.
*본 초록은 AI를 통해 원문을 번역한 내용입니다. 정확한 내용은 하기 원문에서 확인해주세요.