10. 통계 함수 적용

따또·2021년 7월 15일
0

Pandas DA

목록 보기
10/31
post-thumbnail

1) 평균값

import pandas as pd

df = pd.read_csv('./auto-mpg.csv', header = None)

df.columns = ['mpg', 'cylinders', 'displacement', 'horsepower', 'weight', 'acceleration', 'model year', 'origin', 'name']

print(df.mean()) # 데이터프레임 내 열별로 평균값 반환
print(df['mpg'].mean()) # 데이터프레임 내 mpg 열의 평균값 반환
print(df[['mpg', 'weight']].mean()) # 데이터프레임 내 mpg열, weight열의 평균값 반환

2) 중간값

print(df.median()) # 데이터프레임 내 열별로 중간값 반환
print(df['mpg'].median()) # 데이터프레임 내 mpg 열의 중간값 반환

3) 최대값

print(df.max()) # 데이터프레임 내 열별로 최대값 반환
print(df['mpg'].max()) # 데이터프레임 내 mpg 열의 최대값 반환

4) 최소값

print(df.min()) # 데이터프레임 내 열별로 최소값 반환
print(df['mpg'].min()) # 데이터프레임 내 mpg 열의 최소값 반환

5) 표준편차

print(df.std()) # 데이터프레임 내 열별로 표준편차값 반환
print(df['mpg'].std()) # 데이터프레임 내 mpg 열의 표준편차 값 반환

6) 상관계수

print(df.corr())
# 산술 데이터를 가진 열들로 짝을 지을 수 있는 모든 경우의 수를 찾아서 두 열 사이의 상관계수를 구한다!
print(df[['mpg', 'weight']].corr())
# mpg 열과 weight 열로 짝 지을 수 있는 모든 경우의 수를 찾고 두 열 사이의 상관계수를 구함
profile
따또의 DA 벨로그

0개의 댓글