Prophet은 prophet은 facebook에서 만든 시계열 예측 라이브러리다. 시계열 데이터를 예측(모델링)하는 방법론에는 머신러닝 방법론 그리고 고전적인 기법 ARIMA가 있다. Prophet은 머신러닝 기법은 아니며, ARIMA라고 하는 알고리즘 방법론을 응용하고 있다. ARIMA를 이용하면 계절마다의 반복성이나 여름철에 증가하는 전기 사용료를 모델링할 수 있습니다.
원래 fbprophet이라고 설치하고 import할 때도 fbprophet사용 했지만 현재는 prophet으로 바뀌었다. 그래서 설치할때도, import 할 때에도 fbprophet도 아닌 prophet으로 적어야 맞다. fbprophet으로 설치하고 import안되서 삽질하다가 알아냈다.....
출처 : https://chaelist.github.io/docs/ml_application/time_series/
시계열 데이터 준비(만들기)
df = pd.DataFrame({"ds":ds, "y": result})
Prophet 모델을 변수로 만들기 : 계절성 학습모델 생성
m = Prophet(yearly_seasonality = True, daily_seasonality=True);
학습모델에 시계열 데이터로 학습시키기
m.fit(df);
future = m.make_future_dataframe(periods=30);
- 기본구조 : prophet.make_future_dataframe(periods = 365)
- 디폴트 파라미터 freq = 'D',
- 미래 날짜를 만들어준다. 미래의 데이터
프로펫의 predict 함수에, 빈 데이터프레임을 넣어서, 예측 데이터를 채운다. : 미래의 구간 예측 시키기
forecast = m.predict(future);
시계열 데이터란 일정한 시간 동안 수집 된 일련의 순차적으로 정해진 데이터 셋의 집합이다. 시계열 데이터의 특징으로는 시간에 관해 순서가 매겨져 있다는 점과, 연속한 관측치는 서로 상관관계를 갖고 있다.
계절성이란 일정한 빈도를 가지고 주기적으로 반복되는 패턴으로, 해마다 특정한 때 혹은 1주일마다 특정 요일에 나타나는 것 같은 요인이 시계열에 영향을 줄 때 계절성 패턴이 나타난다.
prophet에서는 아무런 설정도 하지 않은 경우 자동으로 연간, 주간 계절성을 파악해서 맞춘다. 여기서는 연간, 일간 계절성을 학습해보겠다.