[CS224W] 4. PageRank

Cherish·2023년 2월 5일
0

CS224W

목록 보기
4/7
  • PageRank : 웹 페이지들의 순위를 매기는 알고리즘
  • 자신의 검색어와 가장 잘 어울리는 페이지를 찾기위한 pageRank
  • 얼마나 많은 사이트들이 참조했는지 + 참조한 사이트들의 영향력은 어떻게 되는지 = Relative importance of Web pages

🔨 PageRank : The Flow Model

r은 중요도 벡터

  • 각 노드는 도착하는 링크의 합으로 중요도를 가진다.
  • 각 out link는 도착하는 노드로의 투표로 간주한다.
  • 각 out link는 출발하는 노드의 중요도 / 출발하는 노드의 out link 수로 투표수를 가지게 된다.

🔨 PageRank : Matrix Formulation

  • Matrix는 행과 열 모두 페이지 수만큼 가지므로 m x m 행렬이다.
  • 각 열의 합은 1이 되고, 각 열은 해당 열 페이지에서 다른 페이지로의 연결을 나타내는 확률분포이다.
  • j 페이지가 dj개의 out link를 가진다고 하면

Rank vector r : An entry per page

  • ri is the importance score of page i

🔨 Random Surfer

페이지를 탐방하는 user의 행동을 random하게 보는 것으로, loop에 빠지거나 더 이상 살펴볼 페이지가 없으면 random하게 다른 페이지를 찾아나서는 행동을 모델에 반영

🔨 Solving PageRank

  • 을 반복하여 수렴할 때까지 계산한다. 이것을 Power Iteration이라 한다.
  • 수렴조건

Reference

https://www.youtube.com/watch?v=rMq21iY61SE&list=PLoROMvodv4rPLKxIpqhjhPgdQy7imNkDn&index=7

0개의 댓글