df.info()
- object: 일반 문자열 타입
- float: 실수
- int: 정수
- category: 카테고리
- datetime: 시간
이런식으로 데이터의 타입을 확인해볼 수 있다. 또한, astype을 이용해서 데이터의 타입을 변경해줄 수 있다.
df["원하는 칼럼명"].dtypes df["원하는 칼럼명"].astype(원하는 데이터 타입)
- Error가 발생하는 경우
NaN 값이 있는 경우에 에러가 발생하기 때문에, fillna를 이용해서 빈값을 임의로 채워준다.df["원하는 칼럼명"].fillna(원하는 값) # 그 다음에 astype 이용해서 원하는 데이터 타입으로 변경하기 df["원하는 칼럼명"].astype(원하는 데이터 타입)
df["생년월일"] df["생년월일"] = pd.to_datetime(df["생년월일"])
- .dt를 이용해서 year, day 등등의 필요한 정보를 뽑아낼 수 있다.
df["생년월일"].dt.year df["생년월일"].dt.month df["생년월일"].dt.day df["생년월일"].dt.hour df["생년월일"].dt.minute df["생년월일"].dt.second df["생년월일"].dt.dayofweek # 무슨 요일인지 알려준다. # 월요일: 0 화요일: 1, 수요일: 2, # 목요일: 3, 금요일: 4, 토요일: 5, 일요일: 6 df["생년월일"].dt.weekofyear # 그 해의 몇 번째 주인지 알려준다.
이런 식으로 원하는 정보를 얻어서 새로운 칼럼을 만들어서 붙이거나, 데이터를 분석할 때의 어떤 기준점이 될 수 있다.