판다스는 시리즈(Series)와 데이터프레임(DataFrame)이라는
구조화된 데이터 형식을 제공한다!
시리즈(Series)
데이터가 순차적으로 나열된 1차원 배열의 형태
index는 value와 일대일대응
python의 dictionary와 비슷한 구조를 가진다고 할 수 있음!
import pandas as pd
dict_data = {'a' : 1, 'b' : 2, 'c' : 3} //dictionary
sr = pd.Series(dict_data) // dict_data를 Series로 변환
인덱스 배열 : Series객체.index
데이터 값 배열 : Series객체.values
import pandas as pd
list_data = ['2021-07-11', 3.14, 'ABC', 100, True]
sr = pd.Series(list_data)
print(sr)
//자동으로 인덱스에 0~4 범위의 정수값이 인덱스로 지정됨
idx = sr.index //인덱스 배열
val = sr.values // 데이터 값 배열
import pandas as pd
tup_data = ('영인', '2010-05-01', '여', True) // 튜플
sr = pd.Series(tup_data, index = ['이름', '생년월일', '성별', '학생여부'])
// 튜플을 시리즈로 변환 + index 값 지정
print(sr[0]) // 1번째 데이터 값 선택 (영인)
print(sr['이름']) // '이름'라벨을 가진 데이터 값 선택 (영인)
print(sr[[1,2]])
// 2번째와 3번째 값 선택
print(sr[['생년월일', '성별']])
// '생년월일', '성별' 라벨을 가진 데이터 값 선택
print(sr[1:2])
// 2번째 값 선택