⚠ 오늘날의 웹페이지의 '하이퍼링크'는 transaction(좋아요, 포스트, 구매 등)에 초점이 맞추어져 있으나, 4강의 강의에서 다루는 내용은 '페이지에서 페이지로 이동'에 초점을 맞춤
Recursive problem으로 생각할 수 있음
node 의 순위 를 아래와 같이 정의
- 노드 의 out-degree
- 를 가리키는 노드 의 중요성 합계/노드의 차수 로 정의
예시: 3개의 웹페이지에서의 "Flow" equations
- 3개의 방정식과 3개의 미지수: 연립방정식(확장성X), 더 우아하게 해결해봅시다
Notions
Stochastic adjacency matrix (not adj-list) : n by n
Rank vector : 페이지당 하나의 항목을 갖는 순위 벡터
위 정의에 따라, 어떤 페이지의 중요도는 간단한 행렬곱으로 표현될 수 있음
👉👉👉
어떻게 동치가 되는가?
- 로 들어오는 in-links가 이라할 때, (2.2.3)의 Matrix formulation에서 다룬 행렬 에 페이지에 대한 확률분포 를 행렬곱하여 다음 시간에 위치할 확률 분포를 꼐산할 수 있음
, 는 stationary distribution
💡 stationary distribution(정적분포) : 초기 분포에 관계 없이 특정 시간이 지난 후, 특정한 분포에 수렴하는 것을 의미 시간에 따라 변하지 않는 평형 상태를 의미함
무방향 그래프의 adj. matrix의 Eigenvector:
를 만족하는 를 의미
- 이는 과 유사한 구조로 생각해볼 수 있음
- 단지 로 치환되고, 상수값(eigenvalue ) 1이 추가된 것 뿐
즉, "Flow Model"의 Equation은
- vector 에서 시작하여, 웹서핑을 계속 진행해나가면..
이는 서퍼가 네트워크에서 어디에 있을 것인가에 대한 장기적인 분포를 나타낸다고 할 수 있음
💡 Katz Index와 연관
: 이 인접행렬이고, 이를 거듭제곱할 시, 한 쌍의 노드 사이의 경로 수를 계산함 (장기적으론 어떤 확률분포를 나타낸다고 할 수 있음)
이 극한이라면, flow equation 을 만족
그렇다면 principal eigenvector 을 어떻게 구하는가?
Initial 를 로 초기화
Iterate
Stop
L1 norm을 이용하여 적정히 수렴할때까지 반복
은 의 principle eigenvector
은 랜덤워크 프로세스의 stationary distribution