[Andrew Ng] 1-2.Bias/Variance

Prettypotato·2026년 2월 15일

Bias-Variance Trade off

  • Bias
    • Bias는 모델이 "예측이 정답에서 일정한 방향으로 벗어나는 경향"을 뜻 함.
    • 높은 Bias이란 모델이 훈련 데이터를 충분히 학습하지 못하거나, 모델이 너무 간단해서 항상 틀리는 방향이 일정하다는 의미다.
    • 낮은 Bias은 모델이 훈련 데이터를 잘 학습하고, 실제 데이터를 정확하게 예측하려고 한다는 의미다.
  • Variance
    • 분산(Variance)은 모델이 "매번 예측이 얼마나 달라지는지"의 정도를 뜻함.
    • 높은 분산은 모델이 훈련 데이터에 너무 민감하게 반응하여, 훈련 데이터가 조금만 바뀌어도 예측이 크게 달라지는 상황을 의미함. 즉, 훈련 데이터에 과도하게 적합되어 예측이 불안정함.
    • 낮은 분산은 모델이 훈련 데이터에 너무 민감하지 않고, 훈련 데이터가 바뀌어도 예측이 일관성 있게 유지되며, 새로운 데이터에 대해서도 잘 일반화된다는 의미임.

Train set과 Validation set의 관계

Basic Recipe for ML

  • 원인이 Bias인지 Variance인지에 따라 대처법이 달라진다. 따라서 Bias가 문제인지 Variance가 문제인지 정확히 판단하는 것이 중요하다.

출처 및 참고 자료

  • Andrew Ng, Improving Deep Neural Network, DeepLearningAI

0개의 댓글