그래프와 추천시스템(8. GNN)

skh951225·2022년 8월 22일

추천시스템

그래프와 추천시스템

목록 보기

8/8

그래프 신경망 기초

그래프 신경망 구조

그래프 신경망은 그래프와 정점의 속성 정보를 입력으로 받습니다.
그래프 신경망은 이웃 정점들의 정보를 집계하는 과정을 반복하여 임베딩을 얻습니다.
각 집계 단계를 층(Layer)라고 부르고, 각 층마다 임베딩을 얻습니다.
대상 정점마다 집계되는 정보가 상이합니다. 이러한 구조를 Computation Graph라고 부릅니다.
서로 다른 대상 정점간에도 층 별 집계 함수는 공유합니다.

그래프 신경망의 학습

집계 함수는 이웃들 정보의 평균을 계산하고 신경망에 적용하는 단계를 거칩니다.
후속 과제(Downstream Task)의 손실함수를 이용한 종단종(End-to-End) 학습도 가능합니다.

그래프 신경망의 활용

학습된 신경망을 적용하여, 학습에 사용되지 않은 정점의 임베딩을 얻을 수 있습니다.
학습된 그래프 신경망을, 새로운 그래프에 적용할 수도 있습니다.

그래프 신경망 변형

그래프 합성곱 신경망

소개한 것 이외에도 다양한 형태의 집계 함수를 사용할 수 있습니다.
아래 그림은 GCN(Graph Convolutional Network) 의 집계함수와 기존 집계함수의 비교입니다.
GraphSAGE의 집계함수입니다. 자신의 임베딩과 연결(Concatenation)하는 점이 독특합니다.
그 밖에 집계함수(AGG)는 목적에 따라 평균, 폴링, LSTM등이 사용될 수 있습니다.

합성곱 신경망과 그래프 신경망의 공통점/차이점

공통점

모두 이웃의 정보를 집계하는 과정을 반복

차이점

합성곱 신경망에서의 이웃의 수가 균일하지만, 그래프 신경망에서는 그렇지 않음
합성곱 신경망에서는 인접 픽셀이 유용한 정보를 담고 있을 가능성이 높지만 그래프의 인접 행렬에서의 인접원소는 제한된 정보를 가지며 인접 행렬의 행과 열의 순서가 임의로 결정되는 경우가 많음

그래프 신경망에서의 어텐션

기본 그래프 신경망의 한계

기본 그래프 신경망에서는 이웃들의 정보를 동일한 가중치로 평균을 냅니다. 그래프 합성곱 신경망에서 역시 단순히 연결성을 고려한 가중치로 평균을 냅니다.

그래프 어텐션 신경망

그래프 어텐션 신경망(Graph Attention Network, GAT)에서는 가중치 자체도 학습합니다. 실제 그래프에서는 이웃 별로 미치는 영향이 다를 수 있기 때문입니다. 가중치를 학습하기 위해서 Self-Attention이 사용됩니다.

각 층에서 정점 i 로부터 이웃 j 로의 가중치 aij는 세 단계를 통해 계산합니다.
(1) 해당 층의 정점 i 의 임베딩 hi에 신경망 W를 곱해 새로운 임베딩을 얻습니다.

(2) 정점 i와 정점 j의 새로운 임베딩을 연결한 후, 어텐션 계수 a를 내적합니다. 어텐션 계수 a는 모든 정점이 공유하는 학습 변수입니다.

(3) (2)의 결과에 Softmax를 적용합니다.