데이터 세트 중에 날짜와 시간 데이터를 포함하는 셀이 종종 존재한다.
이런 데이터들은 해당 셀 안에서 처리할 수 없어, 각각 셀을 생성해서 값을 넣어줘야 한다.
년, 월, 일, 시, 분, 초 각각에 셀을 만들어준 후, 해당 값을 넣어주면 된다.
위 데이터에서는 셀 이름이 DateTime
이므로 이 예제를 가지고 아래 코드를 작성해 보았다.
all_data['DateTime'] = pd.to_datetime(all_data['DateTime'])
all_data['Year'] = all_data['DateTime'].dt.year
all_data['Month'] = all_data['DateTime'].dt.month
all_data['Day'] = all_data['DateTime'].dt.day
all_data['Hour'] = all_data['DateTime'].dt.hour
all_data['Minute'] = all_data['DateTime'].dt.minute
all_data['Second'] = all_data['DateTime'].dt.second
첫번째 줄에서 DateTime
셀을 날짜, 시간 데이터로 해석해준다.
그리고 아래 줄에서 각각의 데이터들을 각각의 셀에 저장해주면 된다.
아래와 같은 결과가 나오는 것을 확인할 수 있다.
이렇게 숫자로 변환덴 데이터로 모델링을 하면 된다.