❔ Main quesion: 몇 개의 node들에 대해서만 label이 주어진 network에서 unlabeled node의 label을 어떻게 assign할 수 있을까?
📌 Alternative framework: Message passing
* Semi-supervised node classification: Unlabeled nodes의 label을 예측한다. (👉지도 + 비지도 동시에)
* Correlations(Dependencies): 비슷한 노드들은 연결되어 있다.
👉 Collective Classification
✅ 네트워크 내의 Correlations 근거
Homophily: 개개인의 특징을 기반으로 사회적 관계가 형성되는데, 이때 비슷한 특징을 가진 사람들은 서로 연결될 확률이 크다. ("Birds of a feather flock together.")
Influence: 사회적 관계가 개개인의 특징, 행동에 영향을 미친다.
❔ 이러한 Correlation을 어떻게 leverage할 것인가?
❔ 그리하여 어떻게 node label 예측을 돕게 할 것인가?
(대략적인 semi-supervised learning은 위 이미지와 같이 이루어진다.)
Semi-supervised binary node classification을 활용한다.
( +Markov Assupmtion: 노드 v의 라벨은 이웃 노드의 라벨에 영향을 받는다.)
이제, Collective Classification의 3가지 step을 소개하겠다.
1. Relational Classification
2. Iterative Classification
3. Correct & Smooth
(공개된 강의록 자료와 실제 강의에서 사용하는 ppt 내용이 살짝 상이한데, 강의에서 소개한 collective classifier model 3가지는 다음과 같다.)
1. Relational Classifiers
2. Iterative Classification
3. Loopy belief propagation