DAY5

마친자·2021년 7월 14일

[코드스테이츠] AI 코스

목록 보기

4/33

pandas dataframe 문자열 칼럼 숫자형(int,float)으로 변환
df.astype(float)
df.astype({'칼럼명':int}) #문자열 칼럼별로 데이터 형식 개별 지정
참고

scatter plot

df1.plot.scatter('칼럼명1', '칼럼명2');

grouby 사용하여 '00'별로 평균 구하기
df_1=df.groupby(['칼럼명1'])['칼럼명2'].mean().reset_index()
groupby사용하면 시리즈로 나오나 .reset_index()를 위 코드로 작성하면 데이터프레임으로 나옴 참고

데이터 정렬 (데이터 값 기준)
 df.sort_values(by='정렬할 컬럼',  ascending = False)  #내림차순(큰 값부터)
오름차순으로 하고 싶으면 ascending = False을 빼고 적어주면 된다

카테고리의 값 세기: 각각 값들이 몇번이나 나타났는지 확인 가능
S.value_count()
시리즈에서만 사용가능, 데이터프레임에서 사용할려면 열을 지정해야함

line graph

import matplotlib.pyplot as plt
plt.plot(data, label= "해당 line 이름") or plt.plot(x값, y값, label= "해당 line 이름")
plt.title("타이틀")
plt.legend() #범례

소수점에 대해 정수로 반올림 or 지정한 소수점 자리수에서 반올림
round(숫자, 지정한 소수점 자리)
>>round(12.6)
13
>>round(12.672,2)
12.67
출처

'O': object

df.info() : df.shape() + df.columns + df.dtypes . df 형식을 올라운드로 알려줌
출처

마루에 미친자