Pandas

200원짜리개발자·2024년 5월 8일
0

인공지능 수업

목록 보기
7/8

학교 수업시간에 배운 Pandas기록

Pandas란?

파이썬 프로그래밍을 통한 데이터 조작 및 분석을 가능하게 해주는 라이브러리

사용법

import pandas as pd을 해서 사용할 수 있다.

DataFrame creation

  • 데이터 프레임은 2차원 형태의 데이터 구조를 나타냄
    • 각 행과 열은 Labeling된 축을 포함
  • DataFrame(data, index, columns, dtype, copy)
    • data: Dataframe을 생성할 데이터
    • index: 각 행에 대한 Label
    • columns: 각 열에 대한 Label
    • dtype: 데이터의 타입
  • index와 columns을 지정하지 않으면 실제 index로 표현됨
subjects = ['국어', '영어', '수학', '탐구']  # index
students = ['A', 'B', 'C', 'D']  # columns

Using dictionary

  • Dictionary를 이용한 df 생성
    • Dictionary를 사용할 경우 자체에서 각 열에 대한 Label과 값을 지정할 수 있음
dict_scores = {'A': [90, 86, 86, 73], 'B': [89, 78, 88, 95], 'C': [47, 65, 83, 74], 'D': [63, 69, 87, 52]}

dict_df = pd.DataFrame(dict_scores, subjects)
dict_df

DataFrame access

기본적인 데이터프레임 접근 방법을 알아본다.

Column access

  • 생성된 데이터프레임은 열의 Label을 통해 바로 접근이 가능
    • 접근 결과는 시리즈(Series) 자료형
      • 1차원의 형태를 가짐
      • 시리즈 자료형은 아래와 같이 데이터프레임 자료형으로 변환 가능
        • pd.DataFrame(df)
        • pd.Series.to_frame(df)
np_df.A

이런식으로 접근 가능

Indexing

  • 열이 문자 Label을 가졌다면 Label을 통해서만 접근 가능
  • 접근 결과는 시리즈(Series) 자료형
  • 행은 Indexing 불가
np_df['A']

과제

sports = ['축구', '야구', '농구'] # index
ban = ['1반', '2반', '3반', '4반'] # column

option = {'축구': ['반', '찬', '반', '찬'], '야구': ['찬', '찬', '찬', '찬'], '농구': ['반', '찬', '반', '반']}

option_df = pd.DataFrame(option, ban)
option_df['롤'] = np.array(['찬', '찬', '반', '찬'])
option_df['롤'] = '찬'
option_df['축구']['1반'] = '찬'


option_df
profile
고3, 프론트엔드

0개의 댓글

관련 채용 정보