2_pandas_describe_info_sort

eunjoo·2023년 10월 15일
0
post-thumbnail

실습에 사용할 예제 파일

http://bit.ly/ds-korean-idol

(국내 아이돌 평판지수 (csv))

import pandas as pd
df

# head() : 맨 앞의 5행의 데이터를 출력한다.
df.head(7)

# tail() : 맨 끝에서5개의 데이터를 출력한다.
df.tail(7)


2. 기본 정보 알아보기 (index, column, info)

2-1. column(열) 출력하기

# pandas에서 dtype이 object인 경우 -> 문자열
df.columns

2-2. column(열) 이름 재정의하기

new_col = ['name', '그룹', '소속사', '성별', '생년월일', '키', '혈액형', '브랜드평판지수']
df.columns = new_col
df.columns

df

2-2. index(행) 출력하기

df.index

2-3. info 는 기본적인 row(행)의 정보와 데이터 타입을 알려줍니다.

tip. info 메소드는 주로 빠진 값 (null 값)과 데이터 타입을 볼 때 활용합니다.
df.info() 
#object는 str이다.


3. 통계 정보 알아보기 (describe)

int float 통계정보
df.describe() #std 표준편차


4. 형태(shape) 알아보기

* shape는 tuple 형태로 반환되며, 첫번째는 row, 두번째는 column의 숫자를 의미합니다
df.shape

df

5. 상위 5개, 하위 5개의 정보만 보기

가장 자주쓰는 메소드 중 하나인 head(), tail()입니다.

  • head() 상위 5개 row 출력
  • tail() 하위 5개 row 출력
  • head(3) 상위 3개 row 출력
  • tail(2) 하위 2개 row 출력
df.head()

df.tail()

df.head(3)

df.tail(2)

6.정렬하기

6-1. 오름차순 정렬 (default)

df.sort_index()

6-2. 내림차순 index 정렬

df.sort_index(ascending=False)

7.column 별로 정렬

7-1. 오름차순 정렬

df.sort_values(by='키') # default 오름차순

7-2. 내림차순 정렬

df.sort_values(by='키', ascending=False)

[BONUS] 복수 정렬

# 정렬 기준 1번 :'키', 키가 동일한 경우 정렬기준 2번 / 복수인 경우 리스트로 넣는다.
df.sort_values(by=['키', '브랜드평판지수'])

df.sort_values(by=['키', '브랜드평판지수'], ascending=False)

0개의 댓글