pandas dataframe 문자열 칼럼 숫자형(int,float)으로 변환
df.astype(float) df.astype({'칼럼명':int}) #문자열 칼럼별로 데이터 형식 개별 지정
scatter plot
df1.plot.scatter('칼럼명1', '칼럼명2');
grouby 사용하여 '00'별로 평균 구하기
df_1=df.groupby(['칼럼명1'])['칼럼명2'].mean().reset_index()
groupby사용하면 시리즈로 나오나 .reset_index()를 위 코드로 작성하면 데이터프레임으로 나옴 참고
데이터 정렬 (데이터 값 기준)
df.sort_values(by='정렬할 컬럼', ascending = False) #내림차순(큰 값부터)
오름차순으로 하고 싶으면 ascending = False을 빼고 적어주면 된다
카테고리의 값 세기: 각각 값들이 몇번이나 나타났는지 확인 가능
S.value_count()
시리즈에서만 사용가능, 데이터프레임에서 사용할려면 열을 지정해야함
line graph
import matplotlib.pyplot as plt plt.plot(data, label= "해당 line 이름") or plt.plot(x값, y값, label= "해당 line 이름") plt.title("타이틀") plt.legend() #범례
소수점에 대해 정수로 반올림 or 지정한 소수점 자리수에서 반올림
round(숫자, 지정한 소수점 자리) >>round(12.6) 13 >>round(12.672,2) 12.67
'O': object
df.info() : df.shape() + df.columns + df.dtypes . df 형식을 올라운드로 알려줌
출처