Simple Linear Regression

REi·2024년 4월 8일

Algorithm

목록 보기
3/4
post-thumbnail
  • 독립 변수가 하나인 경우 단순회귀분석(Simple Linear Regression)이라 한다.

Best-Fit Line

  • 실제 점들(실측값) 사이의 거리를 고려하여 생성되어야 함.
  • best-fit line과 예측된 점들(예측값)들간의 거리는 오차(error)이다.

직선의 방적식 (The equation of line)

y=ax+by=ax +b
  • a:기울기(slope)a : 기울기(slope)
  • b:y절편(yintercept)b : y절편(y-intercept)

평균 제곱 오차 (MSE:Mean Squared Error)

  • MSC(Mean Squared Error) : 평균 제곱 오차

    MSE=1ni=1n(yiyi~)2MSE = \frac{1}{n} \sum_{i=1}^n (y_i - \tilde{y_i})^2
  • yi:예측값y_i : 예측값

  • yi~:실측값\tilde{y_i} : 실측값

  • 1차 정리

    MSE=(y1(ax1+b))2+(y2(ax2+b))2+...+(yn(axn+b))2MSE = (y_1 - (ax_1+b))^2+(y_2-(ax_2+b))^2+...+ (y_n-(ax_n+b))^2
  • 2차 정리

    MSE=y122y1(ax1+b)+(ax1+b)2+...+yn22yn(axn+b)+(axn+b)2MSE = y_1^2 - 2y_1(ax_1+b) + (ax_1+b)^2+...+ y_n^2-2y_n(ax_n+b)+(ax_n+b)^2
  • 3차 정리 (괄호 풀기)

    MSE=y122y1ax12y1b+a2x2+2ax1b+b2+...+yn22ynaxn2ynb+a2xn2+2axn+b+b2MSE = y_1^2-2y_1ax_1-2y_1b+a^2x^2+2ax_1b+b^2+...+y_n^2-2y_nax_n-2y_nb+a^2x_n^2+2ax_n+b+b^2
  • 4차 정리

    MSE=(y12+...+yn2)2a(x1y1+...+xnyn)2b(y1+...+yn)+a2(x12+...+xn2)+2ab(x1+...+xn)+nb2MSE = (y_1^2+...+y_n^2)-2a(x_1y_1+...+x_ny_n)-2b(y1+...+y_n)+a^2(x_1^2+...+x_n^2)+2ab(x_1+...+x_n)+nb^2
  • y,xy,x,x2y,xy,x,x^2의 모든 제곱값의 평균을 취함

    y2ˉ=y12+y22+...+yn2n\bar{y^2}=\frac{y_1^2+y_2^2+...+y_n^2}{n}
  • 방정식의 양쪽을 n으로 곱하여 다음을 얻는다.

    y2ˉn=y12+y22+...+yn2\bar{y^2}n = y_1^2+y_2^2+...+y_n^2

최종 MSE 공식

MSE=ny2ˉ2anxyˉ2bnyˉ+a2nx2ˉ+2abnxˉ+nb2MSE=n\bar{y^2}-2an\bar{xy}-2bn\bar{y}+a^2n\bar{x^2}+2abn\bar{x}+nb^2

MSE함수를 최소화하는 a(기울기)와b(y-절편)를 구하는 것이 목표임.
👉🏻 a에 대한 편미분, b에 대한 편미분 수행
👉🏻 최소점(Global Minima)를 찾고있으므로 편미분을 취하고 0과 비교함

편미분 공식

MSEa=MSEb=0\frac{\partial MSE}{\partial a} = \frac{\partial MSE}{\partial b} =0

편미분 공식 적용

MSEa2nxyˉ+2nx2ˉa+2bnxˉxyˉ+x2ˉa+bxˉ=0\frac{\partial MSE}{\partial a} \Rightarrow -2n\bar{xy} + 2n\bar{x^2}a+2bn\bar{x} \Rightarrow -\bar{xy} +\bar{x^2}a+b\bar{x} =0
ax2ˉxˉ+b=xyˉxˉ\Rightarrow a\frac{\bar{x^2}}{\bar{x}}+b=\frac{\bar{xy}}{\bar{x}}
MSEb2nyˉ+2anxˉ+2bnyˉ+axˉ+b=0\frac{\partial MSE}{\partial b} \Rightarrow -2n\bar{y}+2an\bar{x}+2bn \Rightarrow -\bar{y}+a\bar{x}+b=0
axˉ+b=yˉ\Rightarrow a \bar{x}+b=\bar{y}
b=yˉaxˉb=\bar{y}-a\bar{x}

방정식 빼기

a(xˉx2ˉxˉ)=yˉxyˉxˉa=yˉxyˉxˉxˉx2ˉxˉa(\bar{x}-\frac{\bar{x^2}}{\bar{x}}) = \bar{y} - \frac{\bar{xy}}{\bar{x}}\Rightarrow a=\frac{\bar{y}-\frac{\bar{xy}}{\bar{x}}}{\bar{x}-\frac{\bar{x^2}}{\bar{x}}}
  • 해당 방정식에서 분모를 없애봄
    a=yˉxyˉxˉxˉx2ˉxˉxˉxˉ=xˉyˉxyˉ(xˉ)2x2ˉa= \frac{\bar{y}-\frac{\bar{xy}}{\bar{x}}}{\bar{x}-\frac{\bar{x^2}}{\bar{x}}} ∗ \frac{\bar{x}}{\bar{x}} =\frac{\bar{x}\bar{y}-\bar{xy}}{(\bar{x})^2-\bar{x^2}}

📌 a(기울기) 최종 방정식

a=xˉyˉxyˉ(xˉ)2x2ˉa=\frac{\bar{x}\bar{y}-\bar{xy}}{(\bar{x})^2-\bar{x^2}}

📌 b(y-절편) 최종 방정식

b=yˉaxˉb=\bar{y}-a\bar{x}

📌 xˉ\bar{x} 최종 공식

xˉ=x1+x2+..+xnn\bar{x}=\frac{x_1+x_2+..+x_n}{n}

📌 x2ˉ\bar{x^2} 최종 공식

x2ˉ=x12+x22+..+xn2n\bar{x^2}=\frac{x_1^2+x_2^2+..+x_n^2}{n}

📌 xyˉ\bar{xy} 최종 공식

xyˉ=x1y1+x2y2+...+xnynn\bar{xy}=\frac{x_1y_1+x_2y_2+...+x_ny_n}{n}

📌 yˉ\bar{y} 최종 공식

yˉ=y1+y2+...+ynn\bar{y}=\frac{y_1+y_2+...+y_n}{n}

Global Minima

  • 오류가 최소가 된 곳
  • 오차(Error)를 최소화하는 M(기울기)와 B(y절편)을 찾아야 함.

Example 1

  • 3 points
    (1,2),(2,1),(4,3)

Example 1 예제 - xˉ\bar{x} 구하기

  • xˉ=1+2+43=73\bar{x} = \frac{1+2+4}{3}=\frac{7}{3}

Example 1 예제 - yˉ\bar{y} 구하기

  • yˉ=2+1+33=63=2\bar{y} = \frac{2+1+3}{3}=\frac{6}{3}=2

Example 1 예제 - xyˉ\bar{xy} 구하기

  • xyˉ=12+21+433=163\bar{xy} = \frac{1*2+2*1+4*3}{3}=\frac{16}{3}

Example 1 예제 - x2ˉ\bar{x^2} 구하기

  • x2ˉ=12+22+423=213=7\bar{x^2} = \frac{1^2+2^2+4*2}{3}=\frac{21}{3}=7

Example 1 예제 - a, b 방정식에 대입

a=732163(73)27=1431634997=23149=37a= \frac{\frac{7}{3}*2-\frac{16}{3}}{(\frac{7}{3})^2-7}=\frac{\frac{14}{3}-\frac{16}{3}}{\frac{49}{9}-7}=\frac{-\frac{2}{3}}{-\frac{14}{9}}=\frac{3}{7}
b=23773=21=1b= 2 - \frac{3}{7}*\frac{7}{3}=2-1=1

🔥 Example 1 예제 - 최종 대입 결과

y=37x+1y=\frac{3}{7}x+1

Example 2

  • 4 points
    (-2,-3),(-1,-1),(1,2),(4,3)

Example 2 예제 - xˉ\bar{x} 구하기

  • xˉ=(2)+(1)+1+44=12\bar{x} = \frac{(-2)+(-1)+1+4}{4}=\frac{1}{2}

Example 2 예제 - yˉ\bar{y} 구하기

  • yˉ=(3)+(1)+2+34=14\bar{y} = \frac{(-3)+(-1)+2+3}{4}=\frac{1}{4}

Example 2 예제 - xyˉ\bar{xy} 구하기

xyˉ=(2)(3)+(1)(1)+12+344=6+1+2+124=214\bar{xy} = \frac{(-2)*(-3)+(-1)*(-1)+1*2+3*4}{4}=\frac{6+1+2+12}{4}=\frac{21}{4}

Example 2 예제 - x2ˉ\bar{x^2} 구하기

  • x2ˉ=4+1+1+164=112\bar{x^2} = \frac{4+1+1+16}{4}=\frac{11}{2}

Example 2 예제 - a, b 방정식에 대입

a=2141214112(12)2=2141811214=4142a= \frac{\frac{21}{4}-\frac{1}{2}*\frac{1}{4}}{\frac{11}{2}-(\frac{1}{2})^2}=\frac{\frac{21}{4}-\frac{1}{8}}{\frac{11}{2}-\frac{1}{4}}=\frac{41}{42}
b=14414212=521b= \frac{1}{4}-\frac{41}{42}*\frac{1}{2}=-\frac{5}{21}

🔥 Example 2 예제 - 최종 대입 결과

y=4142x521y=\frac{41}{42}x-\frac{5}{21}

0개의 댓글