[data science] pandas - 날짜와 시간 index

덴장·2026년 4월 29일

data

목록 보기
44/55
  1. Datetime 인덱싱 설정: 데이터프레임에서 특정 컬럼을 인덱스로 설정하기 위해 set_index 함수를 사용하고, 이렇게 설정한 datetime 인덱스를 통해 부분 문자열 인덱싱이 가능하다는 점을 소개합니다.
#index 설정
order_df.set_index('order_time')

order_df = delivery_df.set_index('order_time')
# 또는
order_df.set_index('order_df', inplace=True)

#인덱스 설정 후 정렬
order_df.set_index('order_time').sort_index()

order_df.loc['2015-01-01 04:33:00']
order_df.loc['2015']

  1. Datetime을 통한 데이터 정렬: datetime이 인덱스로 설정된 후 sort_index 함수를 사용하여 시간 순서로 데이터를 오름차순 정렬할 수 있습니다.

  2. 부분 문자열 인덱싱: 부분 문자열 인덱싱을 통해 '2015'와 같은 연도, '2015-06'과 같은 월, 또는 특정 날짜의 데이터를 쉽게 추출할 수 있는 방법을 설명합니다.

  3. 슬라이싱의 차이점: loc과 iloc의 슬라이싱 차이를 설명하며, loc은 콜론 오른쪽의 값을 포함하여 특정 연도 범위의 데이터를 추출할 때 유용하다는 점을 예시로 설명합니다.

order_df.loc['2015':'2017'] #2015~2017포함 3년치 데이터
  1. 부분 문자열 인덱싱의 유연성: 10 미만의 숫자에 대해서는 중간의 0이 빠져 있어도 정확한 결과를 얻을 수 있다는 점을 강조합니다.
  • 예제
import pandas as pd

delivery_df = pd.read_csv('data/delivery.csv')

delivery_df['order_time'] = pd.to_datetime(delivery_df['order_time'])
delivery_df = delivery_df.set_index('order_time')
delivery_df.loc['2022-10-17']

profile
개발자

0개의 댓글