실습에 사용할 예제 파일
http://bit.ly/ds-korean-idol
(국내 아이돌 평판지수 (csv))
import pandas as pd
df
# head() : 맨 앞의 5행의 데이터를 출력한다.
df.head(7)
# tail() : 맨 끝에서5개의 데이터를 출력한다.
df.tail(7)
# pandas에서 dtype이 object인 경우 -> 문자열
df.columns
new_col = ['name', '그룹', '소속사', '성별', '생년월일', '키', '혈액형', '브랜드평판지수']
df.columns = new_col
df.columns
df
df.index
df.info()
#object는 str이다.
df.describe() #std 표준편차
df.shape
df
가장 자주쓰는 메소드 중 하나인 head(), tail()입니다.
df.head()
df.tail()
df.head(3)
df.tail(2)
df.sort_index()
df.sort_index(ascending=False)
df.sort_values(by='키') # default 오름차순
df.sort_values(by='키', ascending=False)
# 정렬 기준 1번 :'키', 키가 동일한 경우 정렬기준 2번 / 복수인 경우 리스트로 넣는다.
df.sort_values(by=['키', '브랜드평판지수'])
df.sort_values(by=['키', '브랜드평판지수'], ascending=False)