실제 세계의 그래프를 표현 혹은 분석하기 위해 실제와 비슷한 그래프를 만드는 것을 목표로 하고 있고 이전에 그 중 하나인 Random Graph를 보았다.
하지만 이는 degree distribution과 clustering coefficient를 만족하지 못하기 때문에 좋은 모델은 아니었다. 또한 중요한 것은 실제 세계에서는 노드들이 점점 늘어나는 반면 Random Graph에서는 고정된 노드 개수 값이 존재했다.
이러한 단점들을 보완하기 위한 모델들이 존재하게 된다.
BA model(Barabasi and Albert)
= Preferential attachment model
Start : t=0일 때 n0개의 노드와 각각 m0개의 edge를 가지고 시작한다.
Features
BA 모델은 크게 2가지를 특징으로 한다.
Growth
단위시간당 노드가 1개씩 추가되게 된다. 각 노드는 m개의 노드들과 연결된다
t=ti 일때 node는 n0+ti 이고 edge는 m0+tim 이 된다.
Preferential attachment
새로 추가되는 노드와 기존의 노드가 연결될 확률은 기존의 노드의 degree에 따라 다르다.
기존의 노드의 degree가 클수록 새로운 노드를 받아들일 확률이 높아진다.
Π(ki)=∑jkjki
Calculating Degree
dtdki(t)=mΠ(ki)=m∑jkjki=2mtmki=2tki(t)
ki(t)는 degree가 t에 따라 변한다는 것을 명시적으로 나타낸 것이다.
시간에 따른 degree 변화량을 계산해 보았을 때 한 timestamp에 총 m개의 노드 연결이 있고 그 것에 노드 i의 확률분포를 곱해 기댓값을 이용할 수 있다.
위에서 구한 등식을 통해 아래과 같이 나타낼 수 있을 것이다.
∫mki(t)kidki=∫tit2tdt
이때 ti는 노드 i가 생성된 timestamp를 의미하고 초기에는 m개의 edge로 시작하기 때문에 ki(ti)=m으로 나타낼 수 있다.
위 적분식을 전개하면 아래와 같이 정리가된다.
ki(t)=m(tit)21
여기서 우리가 알 수 있는 것은 Node의 Degree는 시간에 따라 제곱근으로 증가한다는 것과 노드의 출현 시기가 빠를수록 같은 timestamp에 Degree 값은 더 크다는 것이다.
dtdki(t)=2ttim
또한 다음과 같이 시간에 따른 degree 변화량을 구해보면 변화량은 점점 줄어드는 것을 확인할 수 있다. 그 이유는 경쟁할 노드의 수가 점점 많아지기 때문이라고 생각하면 좋다. 하지만 그보다 중요한 점은 같은 timestamp에 일찍 등장한 노드의 변화량이 더 크다는 것이다.
즉 일찍 등장한 노드는 늦게 등장한 노드보다 같은 timestamp에서 항상 degree값이 크고 또한 degree 변화량(성장 속도)도 크다.
Degree Probability
degree의 확률분포를 구하기 위해 누적확률 분포를 이용한다.
우리는 현재 timestamp에 따른 degree 값을 가지고 있다. 이를 degree distribution으로 만들기 위해서는 degree에 따른 노드의 개수로 바꾸어야한다.
k′≤k를 만족하는 노드를 찾는다
m(tit)21≤k→ti≥k2m2t
다음과 같이 ti 이후에 생성된 노드만 대상이고 그 이전에 생성된 것들은 부등식을 만족하지 않는다
F(k)=P(k′≤k)=n0+tn0+t−k2m2t≈1−k2m2
최종적으로 다음과 같이 유도하여 누적확률분포를 얻을 수 있다.
Degree Distribution Function
P(k)=dkdF(k)=k32m2
누적확률분포를 미분하여 확률분포를 얻을 수 있고 다음 결과를 통해 우리가 아는 Power law Distribution Funtion인 Ck−γ의 형태를 띄고 γ=3 인 모습인 것을 알 수 있다.
특이한 점은 시간에 의존받지않는 함수가 생성된다는 것이다.
Conclusion
Power law distribution : P(k)=k32m2이므로 만족한다
Average path length : ⟨L⟩∼log(log(N))log(N) 으로 나타낼 수 있고 만족한다
Clustering coefficient : C∼N−0.75 굉장히 작은 수치이고 만족하지 않는다
Growing Random Graph
이는 BA 모델에서 preferential attachment를 뺀 것, 혹은 random graph에 growing을 넣은 것과 같은 개념으로 생각할 수 있다.
Features
Growth
Attachment Unifromly at Ramdom
BA 모델과 달리 시간이 지나도 각 노드에 연결될 확률은 동일하다
Π(ki)=n0+t−11
이전과 달리 모든 노드 i에 대해 같은 확률이 적용되는 것을 볼 수 있다.
Degree
ki(t)=m(1+ln(it))
이전에 한 방법과 동일하게 구해보면 다음과 같은 식을 얻을 수 있고 이전에는 (it)에 대해 제곱근으로 증가하였지만 현재는 로그로 증가하며 훨씬 작아진 것을 알 수 있다.
Degree Distribution Function
P(k)=me1−mk
여기서 볼 수 있듯이 지수분포의 형태로 나타내지기 때문에 BA모델을 사용했을 때 보다 그래프가 훨씬 더 빠르게 감소한다는 것을 알 수 있다. 즉 BA모델에서는 Growth도 중요하지만 Preferential Attachment가 없으면 소용이 없다는 것을 알 수 있다.
Power law distribution을 따르는 다른 모델
Link selection model
Growth
Link selection : 노드가 아닌 링크를 임의로 선택한 후 양극단의 노드 중 하나를 무작위로 선택한다.