온라인 Forecasting 교재 [Forecasting : Principles and Practice] 5장 6절을 참고하여 작성하였습니다.
사전 예측
ㄟ(▔,▔)ㄏ 따라서 사전 예상값을 내려면 모델에 예측변수(predictor variable)의 미래 값(예상값)이 필요합니다. ?
사전 예측을 하는 “모델”은
과거 데이터를 기반으로 미래 데이터를 예측해야 하기 때문에,
미래 데이터를 활용한 학습이 필요하다.
(그래야 나중에 test에서도 미래 데이터를 예측할 것이니까)
그래서 미래 값이 필요하다고 하는 것이다.
사후 예측
예측변수 x의 미래 데이터를 기반으로 예측한다. (지나고 난 뒤 지난 일을 예측해본다.)
관측한 실제 예측 변수 값을 사용하여 사후 예측값을 계산한다.
이러한 예측값은 실제 예측값이 아니지만 예측 모델이 작동하는 것을 살펴볼 때 유용하다.
사후 예측값은 예측변수 x에 대한 가정이 가능하지만,
사후 예측값으로 목표 예상변수 y에 대한 가정을 해선 안된다.
ㄟ(▔,▔)ㄏ
관측한 실제 예측 변수 값을 사용하여 사후 예측값을 계산한다.
이러한 예측값은 실제 예측값이 아니지만 예측 모델이 작동하는 것을 살펴볼 때 유용하다. ?
사후 예측은
이미 지난 시점을 모델의 예측 시점으로 잡고
모델을 학습시켜 결과를 확인한다.
이미 지난 시점이므로 해당 시점의 데이터가 존재하기 때문에,
모델의 학습 성능을 파악할 수 있다.
사전 예측과 사후 예측값을 비교 평가하면 예측 불확실성의 원인을 파악할 수 있다.
예제 : 호주 분기별 맥주 생산량
한 예측값 y_hat에 대한 식
회귀 오차가 정규 분포를 따른다면, 위 예측값 y_hat 의 대략적인 95%의 예측구간은 아래와 같다.