Pandas (9)

tino-kim·2022년 1월 4일
0
post-thumbnail

🥴 Pandas (8)

📌 DataFrame type > Series type

df.info()
  • object: 일반 문자열 타입
  • float: 실수
  • int: 정수
  • category: 카테고리
  • datetime: 시간

이런식으로 데이터의 타입을 확인해볼 수 있다. 또한, astype을 이용해서 데이터의 타입을 변경해줄 수 있다.

df["원하는 칼럼명"].dtypes
df["원하는 칼럼명"].astype(원하는 데이터 타입)
  • Error가 발생하는 경우
    NaN 값이 있는 경우에 에러가 발생하기 때문에, fillna를 이용해서 빈값을 임의로 채워준다.
df["원하는 칼럼명"].fillna(원하는 값)
# 그 다음에 astype 이용해서 원하는 데이터 타입으로 변경하기
df["원하는 칼럼명"].astype(원하는 데이터 타입)

📌 날짜를 변환해주는 to_datetime

df["생년월일"]
df["생년월일"] = pd.to_datetime(df["생년월일"])
  • .dt를 이용해서 year, day 등등의 필요한 정보를 뽑아낼 수 있다.
df["생년월일"].dt.year
df["생년월일"].dt.month
df["생년월일"].dt.day
df["생년월일"].dt.hour
df["생년월일"].dt.minute
df["생년월일"].dt.second
df["생년월일"].dt.dayofweek # 무슨 요일인지 알려준다.
# 월요일: 0 화요일: 1, 수요일: 2, 
# 목요일: 3, 금요일: 4, 토요일: 5, 일요일: 6
df["생년월일"].dt.weekofyear # 그 해의 몇 번째 주인지 알려준다.

이런 식으로 원하는 정보를 얻어서 새로운 칼럼을 만들어서 붙이거나, 데이터를 분석할 때의 어떤 기준점이 될 수 있다.

profile
알고리즘과 웹 개발과 데이터 과학을 공부하는 대학생

0개의 댓글