GNN1.

eunsukim·2024년 9월 30일

Why graphs?

  • 그래프는 서로 관계가 있는/ 상호작용하는 개체들을 분석하고 묘사하는데에 보편적으로 쓰이는 Language다.
  • 관계, 상호작용과 같이 추상적인 개념을 다루기 적합하다.
  • 소셜 네트워크, 바이러스 확산 등의 연구 및 분석에 용이하다.

그래프 개요

그래프는 2가지의 구성요소로 이루어진 데이터의 구조다. G = (V,E)

  • Vertices (꼭짓점)
  • Edge (간선)

그래프는 방향성이 있는 edge로 연결된 그래프 = 유향 그래프, 방향성이 없는 edge로 연결된 무향 그래프가 존재한다.

그래프는 인접행렬로 표현이 되기도 하는데, 그래프 G가 N개의 노드를 가질 때, 인접행렬 A는 (N x N) 차원을 가진다.


그래프 분석이 왜 어려운가?

  • 그래프는 euclidean space가 존재하지 않는다. 즉, 우리에게 친숙한 좌표계 상에서 표현할 수 없기 때문이다.
  • 그래프는 항상 고정된 형태로 표현되지 않는다. 다른 형태라도, 인접 행렬은 동일할 수 있다.

  • 그래프의 크기가 거대해지면 (차원이 크고, 노드가 조밀해지면) 그래프를 이해하기 매우 어렵다.

Graph types

  • Directed Graph (유향 그래프)
    두 노드 사이의 방향이 존재하는 그래프
  • Homogeneous / Heterogeneous Graph
    Homogeneous Graph는 그래프의 모든 노드가 같은 성질을 가지는 그래프다. 모든 노드가 homogeneity를 가진다.
    Heterogeneous Graph는 그래프의 노드가 여러 성질을 가지는 그래프이다. 예를 들어 영화-유저 그래프에서 어떤 노드는 영화를, 나머지 노드는 유저를 의미하는 heterogeneity를 가진다.
  • Edge-informative Graph
    그래프의 각 엣지가 가중치를 포함하거나 성질을 가진다.
  • Dynamic Graph
    그래프의 각 노드의 feature와 edge feature 정보가 동적으로 변화한다.

Heterogeneous Graph (이기종 그래프)

주요 구성요소:

  1. 노드 (vertices, V):
    • 이기종 그래프는 여러 유형의 노드가 존재한다. 예를 들어, 하나의 그래프에서 사람, 영화, 제품 등의 서로 다른 타입의 노드가 존재할 수 있다.
  2. 엣지 (edge, E):
    • 노드 간의 관계를 나타내는 엣지도 여러 유형의 관계를 가질 수 있다. 예를 들어, '친구 관계' 또는 '근무 관계' 등이 존재할 수 있다.
  3. 관계 타입 (relational types, R):
    • 엣지의 다양한 관계 유형을 정의한다. 노드 간 상호작용의 성격을 정의한다.
  4. 노드 타입 (node types, R):
    • 각각의 노드는 특정 타입에 속한다. 이를 통해 이기종 그래프는 복잡한 관계를 모델링할 수 있다.

이기종 그래프의 활용:

이기종 그래프는 복잡한 데이터 구조를 다룰 대 매우 유용하다. 데이터 간의 다양한 객체와 그들의 상호작용을 나타내는데 적합하기 때문이다. 데이터의 복잡성과 다양성을 고려해 풍부한 표현이 가능하다.

0개의 댓글