[Pansdas 기초] Data structures(DataFrame, Series)

최한나·2022년 8월 11일
0

pandas

목록 보기
2/2
post-thumbnail

Data structures

차원이름설명
1Series1D labeled homogeneously-typed array
2DataFrameGeneral 2D labeled, size-mutable tabular structure with potentially heterogeneously-typed column

DataFrame

  • 엑셀과 상당히 유사하지만, 프로그램을 만들 수 있음
  • NumPy를 사용해서 수학적인 변경이 훨씬 빠름
  • DataFrame은 다양한 유형의 데이터(문자, 정수, 부동 소수점 값, 범주형 데이터 등 포함)를 열에 저장할 수 있는 2차원 데이터 구조

DataFrame 생성

import pandas as pd

df = pd.DataFrame(
    {
        "Name": [
            "Braund, Mr. Owen Harris",
            "Allen, Mr. William Henry",
            "Bonnell, Miss. Elizabeth",
        ],
        "Age": [22, 35, 58],
        "Sex": ["male", "male", "female"],
    }
)

DataFrame csv 파일에서 읽어오기

  • csv 파일 생성
  • 파일 읽어오기
df = pd.read_csv('people_list.csv')
print(df)
                       Name  Age     Sex
0   Braund, Mr. Owen Harris   22    male
1  Allen, Mr. William Henry   35    male
2  Bonnell, Miss. Elizabeth   58  female

Series

  • DataFrame의 각 열
  • DataFrame의 단일 열이므로 Series에는 열은 없고 행만 존재

Series 생성

import pandas as pd

ages = pd.Series([22, 35, 58], name="Age")
print(ages)
0    22
1    35
2    58

Series 로 DataFrame 생성

s1 = pd.Series([1, 2, 3])
s2 = pd.Series(['one', 'two', 'three'])
df = pd.DataFrame(data=dict(num=s1, word=s2))
print(df)
   num   word
0    1    one
1    2    two
2    3  three

0개의 댓글