[머신러닝 스터디] 머신러닝의 개념과 종류 1
지도학습과 비지도 학습
지도학습
- 회귀(regeression) : 입력번수에 대해 연속형 출력변수 y를 예측
- 분류(classification) : 입력변수에 대해 이산형 출력변수 y를 예측
비지도학습
출력변수가 존재하지 않는다!
- 군집 분석 : 유사한 데이터끼리 그룹화
- PCA : 독립변수들의 차원을 축소화
강화학습 ?
최근 굉장히 핫한 강화학습, 머신러닝의 일부다 아니다 얘기가 있나보다.
- 수많은 시뮬레이션을 통해 현재의 선택이 최대보상이 되도록 학습
머신러닝의 종류
선형 회귀분석 (Linear Regression)
- 독립변수와 종속변수가 선형적인 관계가 있다!는 가정하에 분석
의사결정나무 (Decision Tree)
- 독립변수의 조건에 따라 종속변수를 분리
- 이해하기는 쉬우나 overfitting이 잘 일어남!
KNN (K-Nearest Neighbor)
- 새로 들어온 데이터의 주변 k개의 데이터의 class로 분류
- k는 직접 설정해 줘야한다!
NN (Neural Network)
다음 장에서 자세히
SVM (Support Vector Machine)
- class간의 거리 (margin)이 최대가 되도록!
- 오차를 다른거에 비해 상당히 허용하고 시간이 너무 오래걸림
Ensemble
- 여러개 모델을 결합하면 다 앙상블이야!
- 베깅, 부스팅, 랜덤포레스트만 앙상블이라고 착각하면 안돼~
K-means clustering
- Label 없이 데이터의 군집으로 k개로 생성
- k는 지정해줘야해~