pd.Series([1,2,3], index=['가','나','다'])
가 1 나 2 다 3 dtype: int64
*인덱스를 사용하는 이유
- 데이터 정렬
- 조회
Series와 array 차이는 인덱스 차이
- Series: 인덱스 o
- array: 인덱스 x
DataFrame에서 특정 컬럼을 선택함
ex)series = df[column name] 0 John 1 Jenny 2 Nate 3 Julia 4 Brian 5 Chris Name: name, dtype: object
#pd.Series의 옵션이 무엇이 있는지 확인
- index : 할당값의 지정 이름, 중복 가능
- dtype: 대표적 : int, float, string, boolean등
ex) # series = pd.Series([1,2,3,4], index=['a','b','c','d'],dtype='float)
a 1.0
b 2.0
c 3.0
d 4.0
dtype: float 64 (float 형식)
series.sort_values(ascending= True) #오름차순 설정(내림차순의 경우 ascending=False)
b 2.0
d 4.0
c 5.0
d 10.0
dtype: float 64
DataFrame 실습
df = pd.DataFrame({'a':[2,3], 'b':[5,10]})
a b
0 2 5
1 3 10
df = pd.DataFrame([[2,5],[3,10],[10,20]],columns=['a','b'])
df
a b
0 2 5
1 3 10
2 10 20
## columns를 통해서 columns 이름 지정 가능
## index를 통해서 index 이름 지정 가능
## dtype를 통해서 data type 지정 가능