[Network] Nework 분석을 위한 기본개념

이상해씨·2023년 12월 12일
0

데이터분석

목록 보기
4/5

📌 Network 기본 개념

📌 1. Graph는 무엇인가?

  • 관계를 나타내는 Node와 Edge의 모음
  • edge에는 node간의 연결강도 또는 속성을 나타내는 가중치가 있는 경우도 있음
  • 그래프를 통해 Path Length (경로 길이 : 최단 경로) 및 Diameter (지름 : 최장경로), Community Detection (커뮤니티 탐지 : 하위그룹, 구조 확인), Clustering Coefficient (군집 계수)를 확인할 수 있음.

📌 2. Node 와 Edge

  • Node (vertex) : 그래프에서 원이 되는 객체.
  • Edge (link, tie) : node간의 관계. 그래프에서 선이 되는 부분

📌 3. Node 관계의 특성

1. 비대칭 관계 (Asymmetric Relationship)

  • 한 노드에서 다른 노드로의 관계가 일방향 (방향 존재)
  • A가 B을 가리키나, B는 A를 가리키지 않음 (A → B, B->?A )
  • 이 경우를 가진 네트워크를 "directed network"라고 함

(출처 - directed graphs(MathWorks))

2. 대칭 관계 (Symmetric Relationship)

  • 두 노드 간의 관계가 상호적이며, 양방향으로 발생하는 경우 (방향이 존재하지 않음)
  • A → B 임과 동시에 B → A
  • 이 경우를 가진 네트워크를 "undirected network"라고 함

(출처 - Undirected graphs(MathWorks))

3. 자가루프 (self-Loop)

  • 특정 Node가 자기 자신과 연결될 경우
  • 자기 자신이 직접적으로 연결되어 있는 것
  • 자기 자신에게 보내는 이메일을 예시로 들 수 있음
  • 아래 이미지에서 A, C는 자가루프를 이루고 있음

(출처 - 자가 루프와 다중 그래프(MathWorks))

4. 다중 그래프 (Multigraphs)

  • 두 노드 간의 여러개의 edge가 존재할 수있는 경우
  • 일반적으로는 한쌍의 노드 사이에 최대 하나의 연결만 존재하지만, 다중 그래프에서는 여러개의 다른 연결이 같은 노드 쌍 사이에 존재
  • 이경우, 각각의 edge가 서로 다른 특성 및 가중치를 지님
  • 아래 이미지에서 A, B, C는 다중그래프를 이루고 있음

(출처 - 자가 루프와 다중 그래프(MathWorks))

5. 가중치 네트워크(Weighted Network)

  • 네트워크 구조에서 엣지(관계)들이 가중치(Weight)를 가지고 있는 네트워크
  • 엣지가 단순히 연결 여부뿐 아니라, 그 연결의 강도나 중요도를 나타내는 값을 갖고 있는 경우
  • 가중치 네트워크에서 각 엣지의 가중치는 다양한 요인을 반영
    친밀도, 빈도, 총량 등이 가중치가 될 수 있음
  • 중요한 노드나 연결을 식별하거나, 정보 전파나 영향력 분석에서 각 엣지의 가중치를 고려하여 더 정확한 결과를 얻을 수 있으며, 현실 세계의 복잡한 관계를 표현 할 수 있음

📌 4. 네트워크 분석 지표 Centrality (중심성 지수)

  • 네트워크 내에서 얼마나 중요한 역할을 하는지를 측정하는 지표
  • 중심성은 네트워크 내에서 허브(Hub) 또는 중심 노드인지를 파악하는 데 도움
  • Degree Centrality, Betweenness Centrality, Eigenvector Centrality, Closeness Centrality 등이 있음

1. 연결 중심성(Degree Centrality, Cd)


(출처 - https://wikidocs.net/192599#_2)

노드에 연결된 엣지(관계)의 수

  • 무방향 네트워크에서는 노드의 차수는 해당 노드와 직접적으로 연결된 엣지
  • 방향성이 있는 네트워크에서는 in-degree(들어오는 엣지 수)와 out-degree(나가는 엣지 수)로 나눌 수 있음.

2. 매개 중심성(Betweeness Centrality, Cb)


(출처 - https://wikidocs.net/192599#_2)

네트워크 내에서 특정 노드가 다른 노드들 간의 최단 경로에 얼마나 자주 등장하는지를 측정하는 지표

(다른 노드들간의 중개자 역할을 잘 하는지!)

(특정 노드가 다른 노드들과의 네트워크 구축에 얼나마 영향을 미치는 지)

  • 표가 높은 노드는 다른 노드들 간의 통로로서 중요한 역할을 할 가능성이 큼
  • 이 노드가 제거될 경우 네트워크 내에서 정보 흐름이나 통신에 부정적인 영향
  • 매개 중심성이 높은 노드는 네트워크 내에서 정보 전파에 큰 영향
    (다른 노드들 간의 중개자 역할을 얼마나 하는지를 측정하는 데 초점)

3. 위세 중심성(고유벡터 중심성 : Eigenvector Centraility, Ce)

(출처 - https://wikidocs.net/192599#_2)

해당 노드와 연결된 중요한 노드들의 수와 중요도에 따라 중요성을 측정 (연결된 노드의 중요성을 고려)

  • 중요한 노드와 연결된 노드일수록 더 높은 중심성 (중심성은 특정 노드가 다른 중요한 노드들과 얼마나 연결되어 있는지)
  • 연결된 노드들이 높은 중요도를 갖고 있을수록, 그 노드의 중요성 역시 더 높아짐
  • 네트워크 내에서 영향력이 큰 노드를 찾는 데 사용

4. 근접 중심성(Closeness Centrality, Cc)

(출처 - https://wikidocs.net/192599#_2)

특정 노드가 다른 모든 노드들까지의 평균적인 거리얼마나 가깝게 위치해 있는지를 측정

  • 근접 중심성이 높을수록 해당 노드는 다른 노드들과의 평균적인 거리가 짧다
  • 정보 전파나 통신에서 해당 노드가 얼마나 빠르게 다른 노드들과 상호 작용할 수 있는지를 측정
    (연결된 노드들이 얼마나 중요한지에 따라 해당 노드의 중요성)


참고

profile
공부에는 끝이 없다

0개의 댓글