[Graph] CS224W: Intro (1)

Immanuel·2023년 10월 4일
0

CS224W

목록 보기
1/5

Introduce

스탠포드: CS224W라는 좋은 강의를 발견했습니다.
Jure Leskovec(Computer Science, PhD)께서 GraphML을 강의하시는 내용인데요.
톺아보니, 처음부터 그래프 신경망(GNN)이 아닌, pre-GNN이나 Engineering 접근 방식부터 설명해주신 점이 인상적이었습니다.

강의는 크게 19강으로 구성되어있고, 목차는 아래와 같습니다.

이번 기회에 GNN을 공부하면서, 마주한 비즈니스 문제를 GNN으로 해결할 수 있는지, 혹은 기존 알고리즘과 비교하여 어떤 특징을 보이는지 고민해 볼 예정입니다. 매우 기대되네요.

대략적인 접근 방법으로는 Nodes와 Edges, link로 소셜 네트워크 관계망을 구축할 수 있고
이는 추천 시스템이나 마케팅 target을 선정하는데 활용될 것으로 예상하고 있습니다.


교수님께서 설명해주신 강의의 방향성은 아래와 같습니다.

Main question: 그래프 형태의 관계 구조에 대해, 정확한 예측을 하기 위함

특히 중요한 것은 대부분의 개념(* 소셜 네트워크 관계망뿐만 아니라, 소프트웨어 개발방법)을 그래프 이론에 적용할 수 있기 때문에, 그 활용도가 무궁무진 한 것 같습니다.

그래프 데이터를 처리하기 어려운 이유와 어떻게 처리할 것인지?

그래프 데이터를 처리하기 어려운 이유는 크게 3가지로 말씀하셨습니다.

  1. 그래프 데이터는 임의의 크기와 복잡한 토폴로지를 갖습니다.
    • 토폴로지는 다양한 뜻이 있는데요, 위상수학에서의 토폴로지 정의는 한마디로 연결관계, 네트워크 등으로 정의할 수 있을 것 같습니다.
  2. 그리드나 텍스트처럼 공간적 지역성이 없습니다.
    • 그리드는 위or아래, 텍스트는 좌or우 형태의 공간적 지역성은 있으나, 그래프는 그렇지 않습니다.
  3. 참조점이 없습니다.
    • 고정된 노드 순서가 없다고 하셨습니다. 우리가 딥러닝을 할 수 있는 이유는 고정된 노드가 있기 떄문인데요, 그래프 데이터는 고정된 노드 순서, 즉, 참조점이 없다고 합니다.

그래서 우리는 그래프 데이터를 아래와 같이 처리한다고 합니다.

그래프의 노드를 d차원 벡터에 매핑하여, 공간에 네트워크의 노드-링크인 것처럼 보이게 임베딩

이러한 변환 과정과, GraphSage 아키텍처, Graph Attention Network와 같은 신경망 아키텍처를 중점으로 학습할 예정입니다.

profile
Data Scientist, Machine Learning

0개의 댓글