편향 : 모델이 학습데이터의 패턴을 충분하게 포참 못한경우
분산 :모델이 학습데이터에 과도하게 적합된 경우
정답과 떨어져 있는 정도
결과가 한쪽으로 치우쳐
모델이 패턴을 충분히 학습하지 못해 실제값과 예측값이 차이가 크게 나는 경우
데이터끼리 떨어져 있는 정도
모델이 너무 과적합되어 새로운 데이터에서 성능이 급격하게 떨어지는 현상

A : 낮은 편향 / 낮은 분산 (최적의 모델)
B : 낮은 편향 / 높은 분산
C : 높은 편향 / 낮은 분산
D : 높은 편향 / 높은 분산
분산과 편향간의 균형을 맞추어 에러가 적은 모델을 만들어야 한다
모델 복잡도를 증가하면 편향 감소 / 분산 증가 -> 모델이 과적합되서 새로운 데이터에서 제대로 동작하지 못한다
모델 복잡도를 감소시키면 편향 증가 / 분산 감소 -> 모델이 단순해져 패턴을 제대로 학습하지 못한다, 과소적합

(편향)

(분산)
