pandas는 데이터 처리 및 분석용 파이썬 라이브러리입니다.
R의 데이터프레임처럼 pandas에서도 DataFrame이라는 데이터 구조를 기반으로 합니다.
pandas는 SQL처럼 테이블에 쿼리나 조인 등 조작하는 기능을 제공합니다.
다음 코드는 dictionary를 사용하여 DataFrame을 만드는 예제입니다.
import pandas as pd
from IPython.display import display
data = {'Name': ["Anne", "Becky", "Cathy", "Daisy"],
'Location': ["Seoul", "Incheon", "Busan", "Daejeon"],
'Age': [34,25,41,28]}
data_pandas = pd.DataFrame(data)
display(data_pandas) #IPython.display
R과 DataFrame 문법이 매우 유사합니다.
display(data_pandas[data_pandas.Age>30])
▫ 「Introduction to Machine Learning with Python」, Andreas Müller, O'Reilly, 2021-07-19