
Random Walk 전략과 더불어, node2vec 까지 확장하여 인코더로서의 gnn 이전의 접근법에 대해 살펴보았습니다.

학습을 진행할 세부 topic은 아래와 같다. - random walk approaches for node embeddings - embedding entire graphs - Negative Sampling - Node2Vec - Deep Graph Encoders

25/12/30 12:00~15:00그래프 기계학습 강의 (Stanford CS224)의 Introduction 부분, Node Embedding 부분에 대한 학습을 진행하였습니다.데이터 분석과 관련하여, ADsP 교재를 통해 데이터 사이언스의 미래와 데이터 사이언티스

1\. Stanford CS224W 강의 수강IntroductionNode Embeddings2\. 데이터 분석 활용

2025~2026 동계 모각코 목표는 다음과 같다.Stanford CS224 강의 수강하고, 그래프 신경망에 개념을 학습할 예정이다.Pytorch, 특히 Pytorch Geometric을 활용한 그래프 기반 신경망 구축 실습을 진행할 계획이다.

다중 선형 회귀는 하나의 모델 안에 독립 변수가 여러개일 수 있습니다. 여러 독립변수를 함께 고려한 종속 변수를 예측하기 때문에 단순 선형회귀보다는 더 좋은 성능을 기대할 수 있습니다.

단순 선형 회귀 알고리즘을 학습합니다. 사이킷런(Sklearn) 라이브러리를 사용하여 실습을 진행하고, 최소 제곱법을 손실 함수로 차용하여 해결하는 방법 하나와 확률적 경사하강법(SGD)을 적용시켜 모델을 학습하는 방법 두가지를 살펴봅시다.

Mitchell의 정의에 의하면 머신러닝은, 작업 T를 수행하기 위한 경험 E로부터 획득한 데이터를 기반으로 모델을 자동으로 구성하여 성능 P를 향상시킬 수 있는 컴퓨터 프로그램이다.

동일한 값을 가진 것들끼리 뭉쳐서 계산을 쉽게 할 수 있습니다. 그룹화 문법을 공부해봅시다.

데이터프레임의 컬럼과 row(행)을 수정, 삭제, 추가하는 방법을 알아봅시다.

인덱스와 컬럼을 기준으로 데이터를 정렬하면, 더 편하게 데이터를 확인할 수 있습니다. 데이터 전처리 과정에서 특정 열이나 행을 변환해야 할 때가 있습니다. apply() 함수를 데이터를 적용해봅시다.

결측치(Missing Value)는 말 그대로 데이터에 값이 없는 것을 뜻합니다. 줄여서 'NA'라고 표현하기도 하고, 다른 언어에서는 Null 이란 표현을 많이 씁니다.

loc/iloc을 통해서 데이터를 선택하는 방법에 이어, 일정한 조건을 만들어 데이터를 불러오는 방법을 알아봅시다.

loc은 location의 약자로, df.loc으로 인덱스의 이름을 가지고 원하는 행과 열의 데이터를 불러올 수 있습니다. 또한 iloc은 integer location의 약자로, df.iloc으로 인덱스의 위치를 가지고 원하는 행과 열의 데이터를 불러올 수 있습니다.

판다스 데이터프레임을 거시적인 맥락에서 확인하는 몇가지 방법들을 알아봅시다.

DataFrame 객체를 액셀, CSV, 텍스트 파일 등의 형태로 저장하고 불러오는 방법을 알아봅시다.

데이터프레임(Df)의 인덱스(Index)와 관련된 여러 기능들을 알아봅시다.DataFrame이 가지는 속성중 인덱스(Index)는 프레임의 가장 첫번째 열에서 확인할 수 있습니다.

판다스의 자료구조 데이터프레임은, 엑셀의 데이터 시트처럼 2차원 배열입니다. 다음의 특징을 가지는데 행과 열로 구성되는 2차원 데이터 구조이고 각 열은 각각 데이터 타입(dtype)을 갖고 있습니다.

판다스의 자료구조 `시리즈`는, 1차원 배열로서 다음 세가지의 특징을 가집니다. 차원 배열 구조이자, 인덱스를 사용할 수 있고, 데이터 타입(dtype)을 가집니다.

역시 방향도함수를 정의하는 과정에서 방향(u), 한 점(P), 함수(f) 세가지 정보가 필요함을 알 수 있습니다. 어떤 방향으로 기울기를 구할 것인지(방향 미분계수를 구할 것인지) 단위벡터(u)를 통해 알 수 있는 것입니다.