출처 : https://eyeballs.tistory.com/36
https://wooono.tistory.com/189
PageRank : Google 검색 엔진의 기반 알고리즘으로 하이퍼링크를 이용해 웹 페이지 중요도를 측정한다.
각 A, B, C, D가 페이지를 나타내고 해당 페이지들은 링크를 가지고 있다.
page rank 알고리즘에서 rank 값을 계산하는 함수를 pr
이라고 하고 초기 pr 값은 1/(전체 페이지 개수)
로 정한다.
<초기 pr>
pr(A) = 1/4
pr(B) = 1/4
pr(C) = 1/4
pr(D) = 1/4
pr(A) = (1-DF)/(페이지 전체 개수) + DF * ((A로 향하는 페이지의 현재 pr 값 / A로 향하는 페이지의 out link 개수) 들의 합)
pr(A) = ( 1-DF ) / 4 + DF * (( pr(C) / 3 )).
pr(A) = ( 1-0.85 ) / 4 + 0.85 * ( (1/4) / 3)
A 페이지는 C에서만 링크를 받고 있다 (( pr(C) / 3 )). C는 3개의 out link를 가지고 있다.
pr(B) = (1-DF)/(페이지 전체 개수) + DF * ((B로 향하는 페이지의 현재 pr 값 / B로 향하는 페이지의 out link 개수) 들의 합)
pr(B) = ( 1-DF ) / 4 + DF * ( pr(A) / 2 + pr(C) / 3 )
pr(B) = ( 1-0.85 ) / 4 + 0.85 * ( (1/4) / 2 + (1/4) / 3)
B 페이지는 A와 C로 부터 링크를 받고 있다(( pr(A) / 2 + pr(C) / 3 )).
A 페이지는 2개의 out link를 가지고 있고 C페이지는 3개의 out link를 가지고 있다.
pr(C) = (1-DF)/(페이지 전체 개수) + DF * ((C로 향하는 페이지의 현재 pr 값 / C로 향하는 페이지의 out link 개수) 들의 합)
pr(C) = ( 1-DF ) / 4 + DF * ( pr(A) / 2 + pr(D) / 1 )
pr(C) = ( 1-0.85 ) / 4 + 0.85 * ( (1/4) / 2 + (1/4) / 1)
pr(D) = (1-DF)/(페이지 전체 개수) + DF * ((D로 향하는 페이지의 현재 pr 값 / D로 향하는 페이지의 out link 개수) 들의 합)
pr(D) = ( 1-DF ) / 4 + DF * ( pr(B) / 1 + pr(C) / 3 )
pr(D) = ( 1-0.85 ) / 4 + 0.85 * ( (1/4) / 1 + (1/4) / 3)
pr 값이 높을 수록 중요한 페이지이다.
간단한 그림으로 나타내면 이렇다.
pr 값이 높을 수록 중요한 페이지이다.