주제 : 시계열 데이터 및 시각화 처리
- 생각보다 많은 부분에서 이를 사용한다.
- pd.to_datetime(날짜데이터, format = '입력되는 날짜 형식')
✍ 입력
data['Date'] = pd.to_datetime(data['Date'])
date = pd.Series(['03-01-2023', '03-02-2023', '03-03-2023'])
date = pd.to_datetime(date)
date
✍ 출력
0 2023-03-01
1 2023-03-02
2 2023-03-03
dtype: datetime64[ns]
✍ 입력
# 연도
date.dt.year
# 월
date.dt.month
# 일
date.dt.day
# 요일
date.dt.weekday
# 요일 이름
date.dt.day_name()
[문1] data의 Date는 이미 날짜 타입으로 변환되어 있습니다.
다음의 항목을 열로 추가하시오.
✍ 입력
data['Weekday'] = data['Date'].dt.day_name()
data['Week'] = data['Date'].dt.week
data.head()
✍ 입력
temp = data.loc[:,['Date','Amt']]
# 전날 매출액 열을 추가합시다.
temp['Amt_lag'] = temp['Amt'].shift() #default = 1
# 전전날 매출액 열을 추가.
temp['Amt_lag2'] = temp['Amt'].shift(2) # 2행 shift
# 다음날 매출액 열을 추가합시다.
temp['Amt_lag_1'] = temp['Amt'].shift(-1)
temp.head()
✍ 입력
# 7일 이동평균 매출액을 구해 봅시다.
temp['Amt_MA7_1'] = temp['Amt'].rolling(7).mean()
temp['Amt_MA7_2'] = temp['Amt'].rolling(7, min_periods = 1).mean()
temp.head(10)
✍ 입력
temp['Amt_D1'] = temp['Amt'].diff()
temp['Amt_D2'] = temp['Amt'].diff(2)
temp.head(10)