- [ Pandas ]- Series와 DataFrame

민짜이·2025년 1월 13일

데이터분석

목록 보기
2/14

Series

Series는 엑셀의 한 열(column)이나 리스트에 해당하는 데이터구조입니다. 각각의 값은 인덱스와 연결되어 있으며, 하나의 데이터 속성을 표현합니다.

# dict를 이용해 Series 만들기
sample_dict = {"a" : 1, "b" : 2, "c" : 3} # a, b, c: 각 타겟의 고유한 값
dict_series = pd.Series(sample_dict)
print(dict_series)

위 코드의 결과는 다음과 같습니다.

a    1
b    2
c    3
dtype: int64

DataFrame

DataFrame은 엑셀의 전체 시트(sheet)처럼 행(row)과 열(column)로 구성된 데이터 테이블입니다. 여러 개의 Series가 열 단위로 모여서 만들어집니다.

sample_dict = {
    'Name': ["A", "B", "C"],
    'height': [180.5, 173.1, 178.3],
}

df = pd.DataFrame(sample_dict)
df

위 코드의 출력 결과는 다음과 같습니다.

	Name	height
0	A		180.5
1	B		173.1
2	C		178.3

Series를 합쳐서 DataFrame 만들기

name_series = pd.Series(["A", "B", "C"])
height_series = pd.Series([180.3, 175.3, 178.3])

df = pd.DataFrame({"name": name_series, 'height': height_series})
df

위 코드의 출력 결과는 다음과 같습니다.

	name	height
0	A		180.3
1	B		175.3
2	C		178.3

JSONArray 형식으로 된 데이터를 데이터프레임으로 만들기.

json_sample_array = [
    {"name" : "A", 'height': 180.3},
    {"name" : "B", 'height': 178.3},
    {"name" : "C", 'height': 175.3}
]
df = pd.DataFrame(json_sample_array)
df

위 코드의 출력 결과는 다음과 같습니다.

	name	height
0	A		180.3
1	B		178.3
2	C		175.3
profile
꼬박꼬박

0개의 댓글