Series는 엑셀의 한 열(column)이나 리스트에 해당하는 데이터구조입니다. 각각의 값은 인덱스와 연결되어 있으며, 하나의 데이터 속성을 표현합니다.
# dict를 이용해 Series 만들기
sample_dict = {"a" : 1, "b" : 2, "c" : 3} # a, b, c: 각 타겟의 고유한 값
dict_series = pd.Series(sample_dict)
print(dict_series)
위 코드의 결과는 다음과 같습니다.
a 1
b 2
c 3
dtype: int64
DataFrame은 엑셀의 전체 시트(sheet)처럼 행(row)과 열(column)로 구성된 데이터 테이블입니다. 여러 개의 Series가 열 단위로 모여서 만들어집니다.
sample_dict = {
'Name': ["A", "B", "C"],
'height': [180.5, 173.1, 178.3],
}
df = pd.DataFrame(sample_dict)
df
위 코드의 출력 결과는 다음과 같습니다.
Name height
0 A 180.5
1 B 173.1
2 C 178.3
name_series = pd.Series(["A", "B", "C"])
height_series = pd.Series([180.3, 175.3, 178.3])
df = pd.DataFrame({"name": name_series, 'height': height_series})
df
위 코드의 출력 결과는 다음과 같습니다.
name height
0 A 180.3
1 B 175.3
2 C 178.3
json_sample_array = [
{"name" : "A", 'height': 180.3},
{"name" : "B", 'height': 178.3},
{"name" : "C", 'height': 175.3}
]
df = pd.DataFrame(json_sample_array)
df
위 코드의 출력 결과는 다음과 같습니다.
name height
0 A 180.3
1 B 178.3
2 C 175.3