PageRank

정또치·2023년 6월 26일
0

지식++1

목록 보기
9/15

출처 : https://eyeballs.tistory.com/36
https://wooono.tistory.com/189


PageRank : Google 검색 엔진의 기반 알고리즘으로 하이퍼링크를 이용해 웹 페이지 중요도를 측정한다.

각 A, B, C, D가 페이지를 나타내고 해당 페이지들은 링크를 가지고 있다.
page rank 알고리즘에서 rank 값을 계산하는 함수를 pr 이라고 하고 초기 pr 값은 1/(전체 페이지 개수) 로 정한다.

<초기 pr>

pr(A) = 1/4

pr(B) = 1/4

pr(C) = 1/4

pr(D) = 1/4


A 페이지

pr(A) = (1-DF)/(페이지 전체 개수) + DF * ((A로 향하는 페이지의 현재 pr 값 / A로 향하는 페이지의 out link 개수) 들의 합)

pr(A) = ( 1-DF ) / 4 + DF * (( pr(C) / 3 )).

pr(A) = ( 1-0.85 ) / 4 + 0.85 * ( (1/4) / 3)

A 페이지는 C에서만 링크를 받고 있다 (( pr(C) / 3 )). C는 3개의 out link를 가지고 있다.

-> pr(A) = 0.108333333


B 페이지

pr(B) = (1-DF)/(페이지 전체 개수) + DF * ((B로 향하는 페이지의 현재 pr 값 / B로 향하는 페이지의 out link 개수) 들의 합)

pr(B) = ( 1-DF ) / 4 + DF * ( pr(A) / 2 + pr(C) / 3 )

pr(B) = ( 1-0.85 ) / 4 + 0.85 * ( (1/4) / 2 + (1/4) / 3)

B 페이지는 A와 C로 부터 링크를 받고 있다(( pr(A) / 2 + pr(C) / 3 )).
A 페이지는 2개의 out link를 가지고 있고 C페이지는 3개의 out link를 가지고 있다.

-> pr(B) = 0.214583333


C 페이지

pr(C) = (1-DF)/(페이지 전체 개수) + DF * ((C로 향하는 페이지의 현재 pr 값 / C로 향하는 페이지의 out link 개수) 들의 합)

pr(C) = ( 1-DF ) / 4 + DF * ( pr(A) / 2 + pr(D) / 1 )

pr(C) = ( 1-0.85 ) / 4 + 0.85 * ( (1/4) / 2 + (1/4) / 1)

-> pr(C) = 0.35625


D 페이지

pr(D) = (1-DF)/(페이지 전체 개수) + DF * ((D로 향하는 페이지의 현재 pr 값 / D로 향하는 페이지의 out link 개수) 들의 합)

pr(D) = ( 1-DF ) / 4 + DF * ( pr(B) / 1 + pr(C) / 3 )

pr(D) = ( 1-0.85 ) / 4 + 0.85 * ( (1/4) / 1 + (1/4) / 3)

-> pr(D) = 0.320833333


pr 값이 높을 수록 중요한 페이지이다.


간단한 그림으로 나타내면 이렇다.

pr 값이 높을 수록 중요한 페이지이다.

profile
ddochi

0개의 댓글