💡길이가 3인 anonymous walk의 개수는 5개
💡길이가 5인 anonymous walk의 개수는 52개 .....
💡길이가 12인 anonymous walk의 개수는 4,000,000개 .....
💡 는 길이 인 AW의 총 개수
💡 이며, 로 세팅하면,
💡 개의 AW를 샘플링한다!
단순히 각 AW를 표현하는 것 대신, AW 의 임베딩 를 학습해보자!
이 때, AW의 임베딩 뿐만 아니라, 그래프 임베딩 도 학습
어떻게 walks를 임베딩할까?
Approach :
Notation ; : 학습될 전체 그래프의 임베딩 벡터
(i) node 1에서 시작하여 랜덤워크를 수행
- 노드 의 이웃 : 서로 다른 RW
(ii) -size(윈도우)의 동시발생하는 walks를 예측하기 위해 학습
Objective function
- 예시 기준: 는 노드 1에서 시작되는 AW
- 의 의미는? RW를 수행하는 횟수
- 💡기본적으로는 MLE(최대우도법)에 의해 최적화
- 개만큼의 AW()를 예측하는 것
Objective function 구성요소에 대한 detail
- 분모는 모든 가능한 Walks (이때, 노드 임베딩에서와 마찬가지로 negative sampling을 활용함
- 만큼의 AW임베딩 평균을 에 concat
- 와 는 학습 파라미터로, 선형 레이어를 의미
(iii) 최적화 이후 그래프 임베딩 를 얻음
(iv) 그래프 임베딩 를 이용하여 그래프 분류작업과 같은 예측수행
Concatenate:
유향그래프에 적합, [i,j][j,i]가 다른확률출력
Hadamard:무방향그래프에 적합, A*B=B*A
Sum/Avg:
Distance: