판다스(Pandas)는 파이썬 기반의 대표 라이브러리로 오늘날 데이터 분석(Data Analyst)과 데이터 사이언스(Data Science)에 핵심으로 사용되고 있다.
특히 표 형식의 데이터를 다루는 데 있어 효과적이다. 데이터를 불러오고, 처리하고, 조작, 필터링, 그룹화, 결합 등 다양한 작업에 활용되고 있다.
conda를 활용하여 쉽게 설치할 수 있다.
(설치할 컴퓨터) xxx ~ % conda install pandas정상 설치가 완료되었다면
import를 사용하여 pandas를 불러올 수 있다.import pandas as pd
판다스(Pandas)에서는 대표적인 데이터 구조 2개가 존재한다.
하나는 1차원 데이터 구조로 이루어진 시리즈(Series)가 있고, 또 하나는 2차원 데이터 구조로 이루어진 데이터프레임(DataFrame)이 있다.
시리즈(Series)는 1차원 데이터 구조로, 인덱스(index)와 인덱스에 대응하는 데이터(values)로 이루어져 있다.
데이터프레임(DataFrame)은 2차원 데이터 구조로, 행(row)과 열(column)으로 이루어져 있다.