[Pandas] Series, DataFrame 이해하기 (1)

jae.y·2022년 10월 6일
0
  • Series : 1차원 자료구조
    • 1차원 리스트와 유사하지만 Series는 index에 이름을 부여할 수 있음

  • DataFrame : 2차원 자료구조
    • 행(row)와 열(column) 으로 이루어 짐

1. Series

series 만드는 방법

: dictionary, list, np.array 를 pd.Series로 타입 변환 가능

age = [10, 20, 30]
pd.Series(data=age)
>>> 
0  10
1  20
2  30
dtype: int64

: index 이름 부여

price = [1200, 2000, 3000]
pd.Series(data=price, index=['떡볶이', '라면', '우동'])
>>> 
떡볶이  1200
라면  2000
우동  3000
dtype: int64

=> dtype은 index의 데이터 타입이 아님!

2. DataFrame

데이터프레임 만드는 방법

pd.DataFrame(data, index=) 

데이터프레임 속성값

  • index : index 반환
  • columns : 컬럼 명 반환
  • values : 각 값들을 반환
  • dtypes : 컬럼 데이터 타입을 반환
  • T : 데이터프레임 행, 열 치환

데이터프레임 정렬

  • sort_index() : 행으로 정렬(axis=0), 열로 정렬(axis=1)
  • sort_values() : 데이터 값을 기준으로 정렬
  • 오름차순 : ascending=True, 내림차순 : ascending=False

  • MultiIndex
    정렬할 때, 값들이 비교하기에 적절하지 않은 상태라면?
    예를 들어, 1, 3, "4" | A c D e 등의 형태를 정렬해야한다면?
    => lambda를 이용해 같은 형태로 변환 후 정렬하기
df = pd.DataFrame({"A": [5, 1, 3, 4]}, index=['b', 'A', 'E', 'd'])
df.sort_index(key=lambda x: x.str.lower())
>>>> 
   a
A  1
b  5
d  4
E  3

Reference

profile
데이터 분린이 :)

0개의 댓글