큰 데이터 다루기

타키탸키·2021년 7월 27일

데이터 사이언스

목록 보기

7/26

import pandas as pd
laptops_df = pd.read_csv('data/laptops.csv')

laptops_df.shape

(167, 15) # 167rows(노트북 종류) / 15columns(특징)

laptop_df.head(3) # 맨 위 세 줄 출력

laptop_df.tail(6) # 마지막 여섯 줄 출력

laptops_df.columns

laptops_df.info() # 각 컬럼의 기본 정보 확인
# row 수 다른 경우는 해당 값이 비어있는 것

laptops_df.describe() # 평균, 중간값, 최소최댓값, 표준편차 등

laptops_df.sort_values(by='price') # 가격이 낮은 순으로 정렬

laptops_df.sort_values(by='price', ascending=False) # 가격이 높은 순으로 정렬

laptop_df['brand']

laptop_df['brand'].unique()

laptops_df['brand'].value_counts()

laptops_df['brand'].describe()

* 출처: CODEIT - 데이터 사이언스 입문

There's Only One Thing To Do: Learn All We Can