221024 Python #22

김혜진·2022년 10월 24일
0

Python

목록 보기
20/24

Pandas


설치

pip install pandas

Pandas란

  • 파이썬 언어로 만들어진 빅데이터 분석을 쉽게해주는 프레임워크이다.
  • Pandas DataFrame은 표와 같은 스프레드시트 구조로 데이터를 다룰 수 있다.

Pandas를 사용하는 이유

  • Numpy는 저수준 API가 대부분이므로 여러가지 다양한 고급기술은 Pandas에서 제공
  • 리스트, Numpy 등의 내부데이터와 csv같은 외부 데이터를 Pandas 객체로 만들 수 있다.

Pandas(pd)는 어떤 종류의 데이터를 처리하나

  • 데이터를 matrix 단위로 처리한다.
  • 테이블의 데이터에서 특정 컬럼이나 특정 레코드의 값을 가져와서 변수에 저장한다.
  • 행이나 열 단위의 접근이 가능하다.
  • 데이터의 처리 속도가 매우 빠르다.

    https://pandas.pydata.org/


테이블 형식 데이터를 읽고 쓰는 방법


  • 다양한 파일 형식 또는 데이터 소스(csv, excel, sql, json 등)와 통합을 지원한다.

Pandas(pd)

  • 코드에 import pandas as pd를 선언한다.
    함수를 사용할 때마다 pandas.어쩌구() 식으로 사용해야 한다.
    as pd를 하는 이유는 pandas.의 반복이 불편하므로 pd라는 별명을 붙여준다.
    pandas. 대신 pd를 사용하여 함수를 호출하면 된다.

두 가지 기본 구조

  • Vector 형태의 Series
  • Matrix 형태의 DataFrame

profile
알고 쓰자!

0개의 댓글