DataFrame
- Python pandas 라이브러리에서 제공하는 데이터 구조. R 언어의 DataFrame 데이터 타입을 참고하여 만들어짐
- 행과 열로 구성된 2차원 Data Structure. RDB의 테이블 또는 엑셀(스프레드 시트)과 유사
- 3요소: column, data(row), index
- DataFrame 생성하기
import pandas as pd
df = pd.DataFrame({"A":[1,4,7], "B":[2,5,8], "C":[3,6,9]})
print(df)
DataFrame에서 행(row) 또는 열(column) 선택하기
- 특정 컬럼 조회 ⇒
DataFrame[’columnName’]
- 컬럼명 또는 행의 index 사용 ⇒
DataFrame.loc[]
사용
- 열 또는 행의 순서(위치) 사용 ⇒
DataFrame.iloc[]
사용
- 열의 조건식에 만족하는 행만 추출하는 방법
필요한 열(column) 추출
print(df.loc[:, 'A'])
print(df['A'])
필요한 행(row) 추출
print(df.iloc[1])
print(df.loc[1])
특정 row, column 선택 추출
print(df.loc[0]['A'])
print(df.at[0, 'A'])
column 조건문으로 row 추출
print(df[df['A'] == 1])
print(df[df['A'].isin([1, 7])])
print(df[(df['A'] > 2) & (df['A'] < 8)])