📌헷갈리는 부분 요약
- row를 다룰 땐 loc, iloc을 사용한다.
- row나 column을 지정할 때는 대괄호를 사용한다.
Pandas 라이브러리는 테이블형 데이터를 다룰 수 있는 데이터 분석 라이브러리이다.
Pandas로 데이터를 다루기 위해서는 데이터 타입에 대한 이해가 필요하다.
import pandas as pd
series_data = pd.Series([5,10,15])
series_data = pd.Series([5,10,15],index=['A','B','C'])
series_data.index
series_data.index = ['AA','BB','CC']
series_data.values
series_data['AA']
series_data[0]
del series_data['CC']
series_data.astype(float)
df = pd.DataFrame({ 'A':[90,80,70], 'B':[70,70,80], 'C':[80,80,80]}, index = ['국어','영어','수학'])
df.index
df.index = ['국','영','수']
df.index.name = '과목'
df.columns
df['D'] = [60,60,60]
del df['D']
row를 지정할 때는 loc를 사용한다.
컬럼, row를 지정할 때는 대괄호를 사용한다.
df.loc['사']=[70,80,90]
데이터 프레임을 수정하기 위해서는 'df='을 작성해야 한다.
df = df.drop(['사'])
df.values
df = df.set_index('과목')
df=df.reset_index('과목')
df.iloc[0]
df.loc['국어']
df['A']
df2 = df[['A','B']].copy()
df3 = df.loc[['국어']].copy()