데이터를 Y 알고싶은것, X 알고있는것으로 나눈다.
Y=f(x) + e 이런 관계가 있다고 가정(assumtion)
여기서 f를 추정하는게 머신러닝



오차 줄이는게 목표


2.비모수추정법
f개형에대한 가정없이 바로 fit
장점:모델에대한 가정이없으니 예측성능이 좋을확률을 높임
단점:데이터가 아주많이필요 데이터가적으면 overfitting일뿐
비모수추정은 실제분포가 비선형(복잡)할때 쓴다아

데이터를 봤는데 Y X가 이쁘게 나눠져있으면 지도학습supervised learning
데이터를 봤는데 X만있고 Y가없다 비지도학습Unsupervised learning
-clustering(군집화): 비슷한 x끼리 묶어보자 (분류만 한거지 어떤 범주인지는 몰라서 분류랑다름)