• 쉬운 결손 값(missing data) 처리
• 레이블 위치를 자동적/명시적으로 정리한 데이터 작성
• 데이터 집약
• 고도의 레이블 베이스의 슬라이싱, 추출, 큰 데이터세트의 서브세트화
• 직감적인 데이터세트 결합
• 축의 계층적 레이블 붙임
• 여러가지 데이터 형식에 대응한 강력한 I/O
• 시계열 데이터 고유의 처리
!pip install pandas
1차원 데이터를 다루는 데 효과적인 자료구조
인덱스(레이블)를 가지는 1차원 데이터 (인덱스는 중복 가능)
레이블 또는 데이터의 위치를 지정한 추출 기능, 인덱스에 대한 슬라이스 가능
산술 연산 가능, 통계량을 산출하는 메리트 가짐
pandas.series 클래스를 사용
import pandas as pd
ser = pd.Series([1, 2, 3], index=['a', 'b', 'c'])
ser


ser.loc['b']
-> 2 출력


ser.iloc[2]
-> 인덱스 2에 대응하는 값 출력(3)
ser.iloc[1:3]
-> 인덱스 1, 2에 대응하는 값 출력(2,3)








import os
import pandas as pd
csv = os.path.join('./sample/anime.csv')
df = pd.read_csv(csv)
df.head()
!pip install openpyxl
import pandas as pd
import openpyxl
import os
xlsx = os.path.join("./sample/anime.xlsx")
df = pd.read_excel(xlsx)
df.head()
!pip install pandasql
from pandasql import sqldf
dfsql = lambda q: sqldf(q, globals())
result = dfsql("select name,rating from df where rating > 9.0")
result
url = 'https://docs.python.org/3/py-modindex.html'
tables = pd.read_html(url)
tables