Data structures
차원 | 이름 | 설명 |
---|
1 | Series | 1D labeled homogeneously-typed array |
2 | DataFrame | General 2D labeled, size-mutable tabular structure with potentially heterogeneously-typed column |
DataFrame
- 엑셀과 상당히 유사하지만, 프로그램을 만들 수 있음
- NumPy를 사용해서 수학적인 변경이 훨씬 빠름
- DataFrame은 다양한 유형의 데이터(문자, 정수, 부동 소수점 값, 범주형 데이터 등 포함)를 열에 저장할 수 있는 2차원 데이터 구조
DataFrame 생성
import pandas as pd
df = pd.DataFrame(
{
"Name": [
"Braund, Mr. Owen Harris",
"Allen, Mr. William Henry",
"Bonnell, Miss. Elizabeth",
],
"Age": [22, 35, 58],
"Sex": ["male", "male", "female"],
}
)
DataFrame csv 파일에서 읽어오기
- csv 파일 생성
- 파일 읽어오기
df = pd.read_csv('people_list.csv')
print(df)
Name Age Sex
0 Braund, Mr. Owen Harris 22 male
1 Allen, Mr. William Henry 35 male
2 Bonnell, Miss. Elizabeth 58 female
Series
- DataFrame의 각 열
- DataFrame의 단일 열이므로 Series에는 열은 없고 행만 존재
Series 생성
import pandas as pd
ages = pd.Series([22, 35, 58], name="Age")
print(ages)
0 22
1 35
2 58
Series 로 DataFrame 생성
s1 = pd.Series([1, 2, 3])
s2 = pd.Series(['one', 'two', 'three'])
df = pd.DataFrame(data=dict(num=s1, word=s2))
print(df)
num word
0 1 one
1 2 two
2 3 three