Week5 Day4

김종영·2021년 2월 26일

📋 그래프 정점 표현 학습

📌 정점 표현 학습

정점 표현 학습 간단히 정점 임베딩 $(Node$ $Embedding)$ 은 그래프의 정점들을 벡터 형태로 표현하는 것
정점 임베딩 결과로, 벡터 형태의 데이터를 위한 도구들을 그래프에도 적용할 수 있다. ex) 로지스틱 회귀분석, 다층 퍼셉트론, $K$ - $Means$
정점 표현 학습의 목표는
그래프에서 정점간 유사도를 임베딩 공간에서도 '보존' 하는것
임베딩 공간에서의 유사도는 내적 $(Inner$ $Product)$ 를 사용한다
1) 그래프에서의 정점 유사도를 정의
2) 정의한 유사도를 보존하도록 정점 임베딩을 학습한다.

📌 인접성 기반 접근법

인접성 기반 접근법에서는 두 정점이 인접할 때 유사하다고 간주
다음 손실함수가 최소가 되는 정점 임베딩을 찾는 것을 목표로 한다
그러나 인접성만으로 유사도를 판단하는 것은 한계가 있다.

📌 거리/경로/중첩 기반 접근법

거리 기반 접근법에서는 두 정점 사이의 거리가 충분히 가까운 경우 유사하다고 간주
경로 기반 접근법에서는 두 정점 사이의 경로가 많을 수록 유사하다고 간주
중접 기반 접근법에서는 두 정점이 많은 이웃을 공유할 수록 유사하다고 간주

📌 임의보행 기반 접근법

임의보행 기반 접근법에서는 한 정점에서 시작하여 임의보행 할 때 다른 정점에 도달할 확률을 유사도로 간주한다.
$Node2Vec$ 은 2차 치우친 임의보행을 사용한다.
현재 정점과 직전에 머물렀던 정점을 모두 고려하여 다음 정점을 선택

📌 변환식 정점 표현 학습의 한계

변환식 $(Transductive)$ 방법은 학습의 결과로 정점의 임베딩 자체를 얻는다는 특성
정점을 임베딩으로 변화시키는 함수 즉 인코더를 얻는 귀납식 $(Inductive)$ 방법과 대조

이전 포스트

Week5 Day3

다음 포스트

Week5 Day5

0개의 댓글