편향과 오차

rokky·2023년 4월 3일

통계

목록 보기
15/17

편향(bias)

  • 편향된 데이터 : 실제 데이터를 반영하지 못하고 편향된 데이터
    ex) 만일 얼굴 데이터셋이 서양인 위주라면 -> 동앙인 데이터에 대해 편향된것을 보여줌

편향(bias)과 분산(variance)

  • 편향이 높을 때 : 모델이 예측한 값과 멀리 떨어짐
  • 분산이 높을 때 : 예측한 값들이 서로 멀리 떨어짐

오차(error)

  • 기계 학습 모델 성능 평가를 위해 오차 계산 과정이 필요
    -> 현재 학습 중인 모델이 얼마나 잘못되었는지 측정 필요
  • 오차 : 실제 정답과 우리 모델이 예측한 갓의 차이
    -> 비용(cost) 또는 손실(loss)이라고도 부른다.

평균 제곱 오차(Mean Squared Error)

  • 대표적인 오차 계산 함수중 하나가 평균 제곱 오차이다.
  • 평균 제곱오차는 오차를 제곱한 값의 평균이다.
  • 각 데이터가(입력 x, 정답 y)로 구성될 때 MSE공식은

평균 제곱 오차 계산 예시

  • 나이 예측 모델 parameter θ를 고려해 보자

  • 이는 f(x;θ)로 표현 가능

  • 이때 제곱 오차(squared error)는 다음과 같이 표현 가능
    (f(x;θ)-y)^2

  • 실제 나이가 27인 (y = 27) 안 사람의 얼굴 이미지x가 주어짐

  • 모델의 예측결과가 29라면 제곱오차는 (29-27)^2 = 4 이다.

  • 모델의 예측결과가 27이라면 제곱오차는 0이다.

  • 제곱 오차는 다음과 같이 계산된다.

  • 제곱 오차 : (78-81)^2 = 9

0개의 댓글