[Python][Pandas] [astype('')][pd.to_datetime['컬럼명']]

도도요닝·2022년 8월 15일
0

python

목록 보기
4/12

타입변환 .astype() 타입확인type()

#문자열로 변경
df['컬럼명'] = df['컬럼명'].astype('str')
#타입 확인하는 방법
# 추출하고자 하는 행[0]
type(df['컬럼명'][0])

pd.to_datetime(df['컬럼명'])

  • datetim
    • epandas에서 날짜와 시간 데이터를 처리 하기 위해 지원하는 자료형
    • datetime 자료형 변환 : 연산가능
 df['컬럼']=pd.to_datetime(df['컬럼'])

Timestamp : 변환완료
.dt : 슬라이싱 준비

#연도 추출
df['컬럼'].dt.year
#월 추출
df['컬럼'].dt.month
#일 추출
df['컬럼'].dt.day
#요일 추출 (월요일: 0, 화요일: 1, 수요일: 2, 목요일: 3, 금요일: 4, 토요일: 5, 일요일: 6)
df['컬럼'].dt.dayofweek

데이터 프레임에 추가하는 방법

#컬럼명은 지정
#표 컬럼에 ['Year_컬럼']['Month_컬럼']['Day_컬럼']새롭게 추가
df['Year_컬럼']=df['컬럼'].dt.year
df['Month_컬럼']=df['컬럼'].dt.month
df['Day_컬럼']=df['컬럼'].dt.day

산술연산

사칙연산

  • df['컬럼'] + df['컬럼']
  • df['컬럼'] - df['컬럼']
  • df['컬럼'] * df['컬럼']
  • df['컬럼'] / df['컬럼']
  • df['컬럼'] +10 값 전체에다가 10
    씩 더해주는 것임.

datetime 연산

  • 날짜/시가 연산 하기 위한 조건 : pd.Timedelta
  • pd.to_timedelta(df['컬럼명'], unit='시간 간격 단위')
  • df['컬럼명'] = pd.to_timedelta(df['컬럼명'], unit='시간 간격 단위')

통계 연산

  • 행 계산 (axis = 0), 열 계산 (axis = 1)
#행 평균 #위에서 아래로
df.mean(axis=0)
#열 평균 #왼쪽에서 오른쪽으로
df.sum(axis=1)

0개의 댓글