머신러닝이란?
- 컴퓨터가 학습을 통해 배우는 프로그램을 말한다.
- train(x,y) 데이터를 학습해 test(x)데이터의 정답(label)을 예측한다.
Supervised / Unsupervised Learning
- Supervised : Lable이 정해져있는 데이터(training set)을 가지고 학습하는 것
- 예 : 동물사진분류, 평당 아파트 시세 분류
1) regression : lable이 범위가 연속적일 때
2) classification : 1/0 과 같이 label이 분류가 가능할 때
- Unsupervised : 정답 lable 이없는 데이터를 군집화한 후 새로운 데이터를 예측하는 방법
Linear Regression
데이터가 여러개 있을 때 그 모든 데이터를 최대한으로 만족하는 함수(직선)를 구하는 문제
- Cost(Loss) function
: 실제값과 예측값의 차이의 제곱의 평균, 가장 작은 값을 구하는 것이 목표