
안녕하세요 ~!
다들 .. 오늘 하루 잘 보내고 계셨나요
저는 오늘 알람을 하나도 못 들어서 늦잠을 자버렸습니다......
뿌린대로 거두겠습니다
오늘도 화이팅 🔥🔥🔥
갑자기 왜 수식이냐고요 ..?
사실 저는 수포자라 수식을 쌩까보려했지만,,,
알아야할 수밖에 없더라구요 ..
어찌저찌 수포자버전으로 이해한
선형회귀의 수식 알려드릴게요 !!
ex) 공부시간에 따른 시험 점수
단순 선형 회귀 : 독립변수 1개, 종속변수 1개인 경우
y : 시험점수 (종속변수)
𝑥 : 공부시간 (독립변수)
𝛽0 : 시작점 (공부시간를 아예 안 했을 때 예상 시험점수)
𝛽1 : 기울기 (공부시간이 늘어날 때 예상 시험점수=회귀계수)
𝜖 : 오차항 (모델이 설명하지 못하는 부분)
이렇게
시험 점수는 ~!
공부를 아예 안 했을 때 예상 점수
+공부를 한 시간에 따른 예상 점수
+오차
를 더하면 예측할 수 있습니다
다중 선형 회귀 : 독립변수 여러 개, 종속변수 1개인 경우
y : 시험점수 (종속변수)
𝑥1 : 공부 시간 (독립변수 1)
𝑥2 : 수면 시간 (독립변수 2)
𝑥3 : 과외 시간 (독립변수 3)
𝛽0 : 시작점 (공부시간를 아예 안 했을 때 예상 시험점수)
𝛽1 : 기울기 (공부시간이 늘어날 때 예상 시험점수=회귀계수)
𝛽2 : 기울기 (수면시간이 늘어날 때 예상 시험점수=회귀계수)
𝛽2 : 기울기 (과외시간이 늘어날 때 예상 시험점수=회귀계수)
𝜖 : 오차항 (모델이 설명하지 못하는 부분)
여기서
계산하는 건 단순선형회귀와 똑같습니다
공부를 아예 안 했을 때 예상 점수
+공부시간
+수면시간
+과외시간
+오차
를 더해주면 시험 점수를 예측할 수 있습니다 ~!
근데 여기서 오차는 .. 왜 더하냐고요 ??
실제데이터와 예측데이터는 똑같을 수가 없습니다
마치라잌 여자와 남자의 물리적인 힘의 차이=그냥 그런 줄 아세요
위에서 계속 했던 공부시간에 따른 시험점수의 경우,
공부시간과 수면 시간 등 여러 독립변수가 있었지만,
실제로 학생의 컨디션이나 시험 난이도 등의 다른 요인들이 발생할 수 있기 때문에
이를 오차항으로 표기하고 모델의 예측력을 상승시키고 개선하는 데 도움됩니다 !!
도움이 되셨을지 모르겠지만 ,,
수포자인 저는 여기까지 입니다 🥲🥲🥲
MSE 모델이란
: 회귀 모델에서 모델의 성능을 평가하기 위해 사용됩니다
에러 = 실제 데이터 - 예측 데이터 로 정의하기여기서 저는 ~!!!
뭐야 분산이랑 같은 거 아냐?? 싶었지만
네 제곱을 어쩌구 하고 루트를 씌우는 건 똑같지만
MSE :
모델의 예측 정확도를 평가하기 위해 사용
예측값과 실제값의 차이를 기반으로 계산
분산 :
데이터의 퍼짐 정도를 설명하기 위해 사용
데이터 포인트와 평균 사이의 차이를 기반으로 계산
멍청하지만,,,
수식만 나오면 다 까먹게 되는 저라
그냥 까먹을까봐 써놨습니다....🥲
오늘도 이래저래 많은 걸 알게되네요 ,,,
오늘도 정말 빡쎈 하루였지만 ,,
이러쿵저러쿵 견뎌봤습니다
내일은 과제와 머신러닝 강의 학습하고 돌아오겠습니다 ~!
다들 오늘도 고생 많으셨어요 🍀🍀🍀