1. Pandas 자료구조_Series

따또·2021년 7월 11일
0

Pandas DA

목록 보기
1/31
post-thumbnail

판다스는 시리즈(Series)와 데이터프레임(DataFrame)이라는
구조화된 데이터 형식을 제공한다!

  • 시리즈는 1차원 배열
  • 데이터프레임은 2차원 배열

시리즈(Series)
데이터가 순차적으로 나열된 1차원 배열의 형태
index는 value와 일대일대응
python의 dictionary와 비슷한 구조를 가진다고 할 수 있음!

1) Dictionary -> Series

import pandas as pd

dict_data = {'a' : 1, 'b' : 2, 'c' : 3} //dictionary
sr = pd.Series(dict_data) // dict_data를 Series로 변환

2) 인덱스 배열을 따로 선택 가능

인덱스 배열 : Series객체.index
데이터 값 배열 : Series객체.values

import pandas as pd
list_data = ['2021-07-11', 3.14, 'ABC', 100, True]
sr = pd.Series(list_data)
print(sr)
//자동으로 인덱스에 0~4 범위의 정수값이 인덱스로 지정됨

idx = sr.index //인덱스 배열
val = sr.values // 데이터 값 배열

3) 인덱스 지정 및 원소 선택

import pandas as pd

tup_data = ('영인', '2010-05-01', '여', True) // 튜플
sr = pd.Series(tup_data, index = ['이름', '생년월일', '성별', '학생여부'])
// 튜플을 시리즈로 변환 + index 값 지정

print(sr[0]) // 1번째 데이터 값 선택 (영인)
print(sr['이름']) // '이름'라벨을 가진 데이터 값 선택 (영인)

print(sr[[1,2]])
// 2번째와 3번째 값 선택
print(sr[['생년월일', '성별']])
// '생년월일', '성별' 라벨을 가진 데이터 값 선택

print(sr[1:2])
// 2번째 값 선택
profile
따또의 DA 벨로그

0개의 댓글