Week5 Day4

김종영·2021년 2월 26일

📋 그래프 정점 표현 학습

📌 정점 표현 학습

  • 정점 표현 학습 간단히 정점 임베딩(Node(Node Embedding)Embedding)은 그래프의 정점들을 벡터 형태로 표현하는 것
  • 정점 임베딩 결과로, 벡터 형태의 데이터를 위한 도구들을 그래프에도 적용할 수 있다. ex) 로지스틱 회귀분석, 다층 퍼셉트론, KK-MeansMeans
  • 정점 표현 학습의 목표는
    그래프에서 정점간 유사도를 임베딩 공간에서도 '보존' 하는것
  • 임베딩 공간에서의 유사도는 내적(Inner(Inner Product)Product)를 사용한다
    1) 그래프에서의 정점 유사도를 정의
    2) 정의한 유사도를 보존하도록 정점 임베딩을 학습한다.

📌 인접성 기반 접근법

  • 인접성 기반 접근법에서는 두 정점이 인접할 때 유사하다고 간주
  • 다음 손실함수가 최소가 되는 정점 임베딩을 찾는 것을 목표로 한다
  • 그러나 인접성만으로 유사도를 판단하는 것은 한계가 있다.

📌 거리/경로/중첩 기반 접근법

  • 거리 기반 접근법에서는 두 정점 사이의 거리가 충분히 가까운 경우 유사하다고 간주
  • 경로 기반 접근법에서는 두 정점 사이의 경로가 많을 수록 유사하다고 간주
  • 중접 기반 접근법에서는 두 정점이 많은 이웃을 공유할 수록 유사하다고 간주

📌 임의보행 기반 접근법

  • 임의보행 기반 접근법에서는 한 정점에서 시작하여 임의보행 할 때 다른 정점에 도달할 확률을 유사도로 간주한다.
  • Node2VecNode2Vec은 2차 치우친 임의보행을 사용한다.
    현재 정점과 직전에 머물렀던 정점을 모두 고려하여 다음 정점을 선택

📌 변환식 정점 표현 학습의 한계

  • 변환식(Transductive)(Transductive) 방법은 학습의 결과로 정점의 임베딩 자체를 얻는다는 특성
    정점을 임베딩으로 변화시키는 함수 즉 인코더를 얻는 귀납식(Inductive)(Inductive) 방법과 대조

0개의 댓글