1. 머신러닝 statistical learning

이재모·2022년 11월 3일

머신러닝

데이터를 Y 알고싶은것, X 알고있는것으로 나눈다.
Y=f(x) + e 이런 관계가 있다고 가정(assumtion)
여기서 f를 추정하는게 머신러닝

왜 f를 예측하는가?

Y를 예측하려고(prediction)

  • f형태가 뭔지는 크게 관심이없다. 나는 X가 들어갔을때 Y값이 궁금하다.
  • 평가 모델

    앞이 줄일수있는 에러 + 줄일수없는 에러


오차 줄이는게 목표

f가 궁금해서 (Inference) --통계학

  • 광고를 얼마나 해야 접속자 수가늘까?
  • 가설을 세우고 검정

f를 어떻게 추정하는가?

  1. 모수추정법

    x와 y를 집어넣어 b를 추정
    모수를 추정하는게 모델을 추정하는것
    장점:간단해서 이해편함
    단점:애초에 모델가정이틀리면 내가 가진데이터에만 맞는 overfitting일어남

2.비모수추정법
f개형에대한 가정없이 바로 fit
장점:모델에대한 가정이없으니 예측성능이 좋을확률을 높임
단점:데이터가 아주많이필요 데이터가적으면 overfitting일뿐

비모수추정은 실제분포가 비선형(복잡)할때 쓴다아


데이터를 봤는데 Y X가 이쁘게 나눠져있으면 지도학습supervised learning

데이터를 봤는데 X만있고 Y가없다 비지도학습Unsupervised learning
-clustering(군집화): 비슷한 x끼리 묶어보자 (분류만 한거지 어떤 범주인지는 몰라서 분류랑다름)

profile
팀장이재모

0개의 댓글