📌 Network 기본 개념
📌 1. Graph는 무엇인가?
- 관계를 나타내는 Node와 Edge의 모음
- edge에는 node간의 연결강도 또는 속성을 나타내는 가중치가 있는 경우도 있음
- 그래프를 통해 Path Length (경로 길이 : 최단 경로) 및 Diameter (지름 : 최장경로), Community Detection (커뮤니티 탐지 : 하위그룹, 구조 확인), Clustering Coefficient (군집 계수)를 확인할 수 있음.
📌 2. Node 와 Edge
- Node (vertex) : 그래프에서 원이 되는 객체.
- Edge (link, tie) : node간의 관계. 그래프에서 선이 되는 부분
📌 3. Node 관계의 특성
1. 비대칭 관계 (Asymmetric Relationship)
- 한 노드에서 다른 노드로의 관계가 일방향 (방향 존재)
- A가 B을 가리키나, B는 A를 가리키지 않음 (A → B, B->?A )
- 이 경우를 가진 네트워크를 "directed network"라고 함
(출처 - directed graphs(MathWorks))
2. 대칭 관계 (Symmetric Relationship)
- 두 노드 간의 관계가 상호적이며, 양방향으로 발생하는 경우 (방향이 존재하지 않음)
- A → B 임과 동시에 B → A
- 이 경우를 가진 네트워크를 "undirected network"라고 함
(출처 - Undirected graphs(MathWorks))
3. 자가루프 (self-Loop)
- 특정 Node가 자기 자신과 연결될 경우
- 자기 자신이 직접적으로 연결되어 있는 것
- 자기 자신에게 보내는 이메일을 예시로 들 수 있음
- 아래 이미지에서 A, C는 자가루프를 이루고 있음
(출처 - 자가 루프와 다중 그래프(MathWorks))
4. 다중 그래프 (Multigraphs)
- 두 노드 간의 여러개의 edge가 존재할 수있는 경우
- 일반적으로는 한쌍의 노드 사이에 최대 하나의 연결만 존재하지만, 다중 그래프에서는 여러개의 다른 연결이 같은 노드 쌍 사이에 존재
- 이경우, 각각의 edge가 서로 다른 특성 및 가중치를 지님
- 아래 이미지에서 A, B, C는 다중그래프를 이루고 있음
(출처 - 자가 루프와 다중 그래프(MathWorks))
5. 가중치 네트워크(Weighted Network)
- 네트워크 구조에서 엣지(관계)들이 가중치(Weight)를 가지고 있는 네트워크
- 엣지가 단순히 연결 여부뿐 아니라, 그 연결의 강도나 중요도를 나타내는 값을 갖고 있는 경우
- 가중치 네트워크에서 각 엣지의 가중치는 다양한 요인을 반영
친밀도, 빈도, 총량 등이 가중치가 될 수 있음
- 중요한 노드나 연결을 식별하거나, 정보 전파나 영향력 분석에서 각 엣지의 가중치를 고려하여 더 정확한 결과를 얻을 수 있으며, 현실 세계의 복잡한 관계를 표현 할 수 있음
📌 4. 네트워크 분석 지표 Centrality (중심성 지수)
- 네트워크 내에서 얼마나 중요한 역할을 하는지를 측정하는 지표
- 중심성은 네트워크 내에서 허브(Hub) 또는 중심 노드인지를 파악하는 데 도움
- Degree Centrality, Betweenness Centrality, Eigenvector Centrality, Closeness Centrality 등이 있음
1. 연결 중심성(Degree Centrality, Cd)
(출처 - https://wikidocs.net/192599#_2)
노드에 연결된 엣지(관계)의 수
- 무방향 네트워크에서는 노드의 차수는 해당 노드와 직접적으로 연결된 엣지
- 방향성이 있는 네트워크에서는 in-degree(들어오는 엣지 수)와 out-degree(나가는 엣지 수)로 나눌 수 있음.
2. 매개 중심성(Betweeness Centrality, Cb)
(출처 - https://wikidocs.net/192599#_2)
네트워크 내에서 특정 노드가 다른 노드들 간의 최단 경로에 얼마나 자주 등장하는지를 측정하는 지표
(다른 노드들간의 중개자 역할을 잘 하는지!)
(특정 노드가 다른 노드들과의 네트워크 구축에 얼나마 영향을 미치는 지)
- 표가 높은 노드는 다른 노드들 간의 통로로서 중요한 역할을 할 가능성이 큼
- 이 노드가 제거될 경우 네트워크 내에서 정보 흐름이나 통신에 부정적인 영향
- 매개 중심성이 높은 노드는 네트워크 내에서 정보 전파에 큰 영향
(다른 노드들 간의 중개자 역할을 얼마나 하는지를 측정하는 데 초점)
3. 위세 중심성(고유벡터 중심성 : Eigenvector Centraility, Ce)
(출처 - https://wikidocs.net/192599#_2)
해당 노드와 연결된 중요한 노드들의 수와 중요도에 따라 중요성을 측정 (연결된 노드의 중요성을 고려)
- 중요한 노드와 연결된 노드일수록 더 높은 중심성 (중심성은 특정 노드가 다른 중요한 노드들과 얼마나 연결되어 있는지)
- 연결된 노드들이 높은 중요도를 갖고 있을수록, 그 노드의 중요성 역시 더 높아짐
- 네트워크 내에서 영향력이 큰 노드를 찾는 데 사용
4. 근접 중심성(Closeness Centrality, Cc)
(출처 - https://wikidocs.net/192599#_2)
특정 노드가 다른 모든 노드들까지의 평균적인 거리에 얼마나 가깝게 위치해 있는지를 측정
- 근접 중심성이 높을수록 해당 노드는 다른 노드들과의 평균적인 거리가 짧다
- 정보 전파나 통신에서 해당 노드가 얼마나 빠르게 다른 노드들과 상호 작용할 수 있는지를 측정
(연결된 노드들이 얼마나 중요한지에 따라 해당 노드의 중요성)
참고