cs224w | Lecture 4. Link Analysis: PageRank

sungyeon park·2022년 10월 9일
0

Graph Learning

목록 보기
3/3

PageRank: The "Flow" Model

  • A page is important if it is pointed to by other important pages

  • Connection to random walk

  • What is the long-term distribution of the surfers?

  • PageRank is the stationary distribution of random-walk

  • 결국 eigenvalue가 1인 행렬 M의 eigenvector를 구하는 문제

  • Summary

PageRank: How to solve?

  • Power Iteration

  • Problems of Spider Traps / Dead ends
    -> Use Teleports
  • PageRank에서는 구글 행렬을 사용함: β\beta를 설정하여 다른 노드로 랜덤하게 teleport함

Random Walk with Restarts / Personalized PageRank

  • Personalized PageRank는 다른 노드로 teleport하는 확률이 uniform하지 않음

Matrix Factorization and Node Embeddings

  • Node가 유사하다는 건 서로 연결되어 있다는 것. 즉,
    ZTZ=A\bold{Z}^{T}\bold{Z} = A
  • 하지만 실제로 embedding dimension d보다 number of node n이 훨씬 큼. 따라서, factorization으로 A size가 나오는건 현실적으로 불가능.
  • 하지만 둘의 차이가 작아지도록 Z\bold{Z}를 근사할 수는 있음.

  • DeepWalk, Node2Vec

  • Limitations
    1. Cannot obtain embeddings for nodes not in the training set

    1. Cannot capture structural similarity
    2. Cannot utilize node, edge and graph features
profile
General Engineer

0개의 댓글