TIL - 2023.05.30

배엘리·2023년 5월 30일
0

TIL

목록 보기
1/23

이제 머신러닝 advance과정으로 들어가게 되었다.
인공지능회귀분석, 머신러닝basic에서 언제 시간이 이렇게 흘러 머신러닝 advance로 들어가게 되었는지... 이러다 배웠던 지식들이 사라질 것 같아 TIL을 작성하게 되었다.


📝 오늘 공부한 내용

ML PJT WORKFLOW

  • 데이터 분석 문제 정의
  • 데이터

Data Split

용도에 따라 데이터를 분리

  • Train : 학습에 사용하는 데이터
  • Validation : 학습 성능을 검증하는 데이터
  • Test Data : (학습하지 않은 데이터) 예측 성능 확인에 사용하는 데이터

회귀분석

주어진 데이터(X)를 통해서 원하는 값(y=target value)를 예측하는 방법

1. Linear Regression

feature와 target 사이의 관계를 선형 모델로 찾자

예측 값

y^=w1x1+w2x2+b\hat{y} = w_1x_1 + w_2x_2 + b

Error

error=yy^2error = |y - \hat{y}|^2

여기서
yy는 실제값, y^\hat{y}는 예측값이다.

Loss Function (cost function)
데이터를 토대로 산출한 모델의 예측값과 실제 값의 차이

LossFunction(L)=iNyy^2Loss Function(L)=\sum_{i}^\N{|y - \hat{y}|^2}

--> 얘를 Sum of squared Error (잔차의 합)이라고 부름

2. Gradient Descent Algorithm

Loss가 최소가 되는 지점을 찾고 싶다.

경사 하강법에서의 가중치

wn=wn1αwnw_n = w_{n-1} -\alpha\nabla w^n

언제 그만 이동할까?
1. 변화가 거의 없을 때
2. 특정 횟수 이상 반복되었을 때

🌷 느낀점

뭐든지 기초를 탄탄히 해야 잘 해낼 수 있다는 것을 깨달았다.
특히 머신러닝에서는 수학도 잘 알아야하고 많은 것들을 초석부터 잘 닦아둬야 미래가 밝다는 것도 어렴풋이 깨달았다 ㅎㅎ

0개의 댓글