- 그래프의 정점을 벡터로 표현하는 방법인 정점 임베딩(Node Embedding)에 대해서 배운다
- 기계학습의 다양한 툴은 벡터로 표현된 데이터를 입력으로 받는다
- 이러한 툴들을 이용해서 그래프를 분석할 수 있을까?
- 그래프를 벡터로 나타낼 수 있으면 가능하다
- 정점을 어떻게 벡터로 표현하는지, 정점 사이의 유사성을 어떻게 표현하는 지 집중하자
정점 표현 학습 이란 그래프의 정점들을 벡터의 형태로 표현 하는 것이다__
정점 표현 학습의 입력은 그래프다
어떤 기준으로 정점을 벡터로 변환해야할까?
임베딩 공간에서의 유사도로는 내적(Inner Product) 를 사용한다
그래프에서 두 정점의 유사도는 어떻게 정의할까?
정리하면, 정점 임베딩은 다음 두 단계로 이루어진다
인접성(Adjacency) 기반 접근법 에서는 두 정점이 인접할 때 유사 하다고 간주한다
인접성 기반 접근법의 손실 함수(Loss Function) 는 아래와 같다
경로 기반 접근법 에서는 두 정점 사이의 경로가 많을 수록 유사하다고 간주한다
두 정점 와 의 사이의 경로 중 거리가 인 것들을 고려하게 된다
변환식 임베딩 방법은 여러 한계를 갖는다
다음에는 이런 단점을 극복한 귀납식 임베딩 방법을 소개한다
출력으로 인코더를 얻는 귀납식 임베딩 방법 은 여러 장점을 갖는다