Python - Pandas

GYO·2021년 8월 3일
0
post-thumbnail

판다스 ?

Pandas는 데이터의 조작과 분석을 위해 사용되는 python 라이브러리이다.

구조화되어있는 데이터를 효과적으로 처리/저장할 수 있다.

앞서 언급한 바와 같이 대부분의 컴퓨터 데이터는 다차원 배열로 저장되므로 보통 Numpy와 같이 import하여 사용한다

import pandas as np

관습적으로 np라는 별칭으로 사용한다.

Pandas의 Series 개체는 Numpy의 array 가 보강된 형태로 Data 와 Index를 가진다. 이때 데이터 타입은 ndarray이다

<class 'pandas.core.series.Series'>

예시

import pandas as pd 
data = pd.Series({'a': 100 , 'b' : 90 , 'c' : 80})
# 직접 dict 선언하는 것처럼 열과 행값을 입력해서 
series 개체를 만들 수 있다. 

dict1 = {'k1':'사과','k2':'바나나','k3':'참외'}
data2 = pd.Series(dict1)
# 별도로 선언된 딕션형 자료를 arg로 받아서 series를 만드는것도 가능 

data.index.name = "등급"
data2.index.name = "과일코드"
# 인덱스에 이름을 줄수도 있다 

=====< 이하 출력 >=====
print(data,'\n')
print("인덱스는 :",data.index)
print("값은     :",data.values)

print()

print(data2,'\n')
print("인덱스는 :",data2.index,'\n타입은 :', type(data2.index))
print()
print("값은     :",data2.values,'\n타입은 :', type(data2.values))


출처 및 환경

profile
Hope that fully-automated society comes true

0개의 댓글