시계열 데이터란? 시간의 흐름에 따라 관측치가 변하는 데이터
모델 성능을 살펴보았을 때, 시계열 데이터의 경우 데이터를 섞었을 경우 모델 성능에 변화가 나타남. 반대로 일반 데이터의 경우 데이터가 섞여도 영향을 그리 크게 받지 않음
import pandas as pd
import statsmodels.api as sm
df = pd.read_csv('file path')
df.head()
df['Month'] = pd.to_datetime(df['Month'])
df = df.set_index('Month')
df.plot(kind='line')
df
import matplotlib.pyplot as plt
decomposed = sm.tsa.seasonal_decompose(df["#Passengers"], model='additive')
fig = decomposed.plot()
fig.set_size_inches(10, 10)
plt.show()
import matplotlib.pyplot as plt
decomposed = sm.tsa.seasonal_decompose(df["#Passengers"], model='multiplicable')
fig = decomposed.plot()
fig.set_size_inches(10, 10)
plt.show()