복잡한 그래프 구조 내의 노드들을 저차원 벡터 공간으로 매핑하여 그래프의 구조적 관계를 수치적으로 표현하는 기법
각 방법들은 그래프의 구조와 응용 분야에 따라서 장단점이 있고, 연구나 실무 환경에서 요구하는 정보에 따라 적절한 방법을 선택하면 된다.
그래프에서 임의보행(random walk)을 수행하여, 노드 시퀸스를 생성 후 자연어 처리에서 사용하는 Skip-gram 모델을 적용해 임베딩을 학습한다.
여기서 조금 생소할 수도 있는 용어를 간단하게 정리하겠다..
간단하게 요약하면, Random walk는 그래프의 지역적 관계를 임의 경로를 통해 탐색해서 '문맥'을 구성하고 Skip-gram 모델은 이 '문맥'을 기반으로 노드(단어)의 의미를 저차원 벡터로 학습하는 방법으로 두 기법을 결합하게 되면, 복잡한 구조를 효과적으로 반영하는 임베딩 학습에 매우 유용하게 사용될 수 있다.
두 기법에 대해서는 나중에 자세히 다루어 보겠다.
Node2vec은 Deepwalk의 확장 버전으로 임의 보행과정에서 BFS(너비 우선탐색)과 DFS(깊이우선 탐색)의 특성을 조절할 수 있는 현향된 (random walk with bias) 보행전략을 도입한다.
*특징
Line은 매우 대규모의 네트워크에서도 효율적으로 임베딩을 학습할 수 있도록 설계된 방법임
*과정
GCN은 신경망을 그래프 데이터에 적용한 모델로, 각 노드의 특성을 이웃노드의 정보와 결합해 갱신하는 방식을 동작
--> 여기서 다운스트림 작업이란 사전 학습이나 임베딩 등에서 얻은 모델 도는 표현을 실제 응요 문제에 활용하는 작업을 뜻함
쉽게 예를 들어 설명하자면, 텍스트 임베딩을 학습한 후에 문서 분류, 감성 분석, 질의 응답, 추천 시스템 등을 수행하는 것.. 다시말해, 사전학습모델이 범용적인 표현을 학습한 후, 이표현을 바탕으로 구체적인 문제해결에 적용하느 과정을 의미

출처: [Graph Embedding Techniques, Applications, and Performance: A Survey] Palash Goyal, Emilio Ferrara (https://arxiv.org/abs/1705.02801)