DAY5

마친자·2021년 7월 14일
0

Load and Explore the Data

pandas dataframe 문자열 칼럼 숫자형(int,float)으로 변환

df.astype(float)
df.astype({'칼럼명':int}) #문자열 칼럼별로 데이터 형식 개별 지정

참고

scatter plot

df1.plot.scatter('칼럼명1', '칼럼명2');

Data Manipulation

grouby 사용하여 '00'별로 평균 구하기

df_1=df.groupby(['칼럼명1'])['칼럼명2'].mean().reset_index()

groupby사용하면 시리즈로 나오나 .reset_index()를 위 코드로 작성하면 데이터프레임으로 나옴 참고

데이터 정렬 (데이터 값 기준)

 df.sort_values(by='정렬할 컬럼',  ascending = False)  #내림차순(큰 값부터)

오름차순으로 하고 싶으면 ascending = False을 빼고 적어주면 된다

카테고리의 값 세기: 각각 값들이 몇번이나 나타났는지 확인 가능

S.value_count()

시리즈에서만 사용가능, 데이터프레임에서 사용할려면 열을 지정해야함

참고

EDA

line graph

import matplotlib.pyplot as plt
plt.plot(data, label= "해당 line 이름") or plt.plot(x값, y값, label= "해당 line 이름")
plt.title("타이틀")
plt.legend() #범례

참고


N112

소수점에 대해 정수로 반올림 or 지정한 소수점 자리수에서 반올림

round(숫자, 지정한 소수점 자리)
>>round(12.6)
13
>>round(12.672,2)
12.67

출처

'O': object

df.info() : df.shape() + df.columns + df.dtypes . df 형식을 올라운드로 알려줌
출처

profile
마루에 미친자

0개의 댓글