참고: 머신러닝 완벽가이드
판단스에는 인덱싱을 지원하는 3개의 연산자가 있습니다.
데이터프레임에 사용되는 [] 연산자는 넘파이 또는 series의 []연산자와 쓰임이 다릅니다.
[]의 입력값은 칼럼명(칼럼 리스트) 또는 불린 인덱스 용도로만 사용해야합니다.
[0:2]와 같은 슬라이싱 연산으로 데이터 추출은 지양합니다.
[]에는 칼럼명 또는 불린 인덱스가 들어갑니다.
행, 열의 구분이 없습니다.
df = pd.DataFrame(
data=[
[1, 2, 3],
[4, 5, 6],
[7, 8, 9]
],
index=[1, 2, 3],
columns=["a", "b", "c"]
)
df["b"]
df[["b", "c"]]
df[df["b"] > 2]
명칭 기반 인덱싱 - 인덱스나 칼럼명으로 데이터 접근
위치 기반 인덱싱 - 행, 열의 위치 좌표로만 데이터 접근
명칭 기반 인덱스 연산자
행 - 인덱스
열 - 칼럼명
df = pd.DataFrame(
data=[
[1, 2, 3],
[4, 5, 6],
[7, 8, 9]
],
index=[1, 2, 3],
columns=["a", "b", "c"]
)
df.loc[[1, 2], "b"]
위치 기반 인덱스 연산자
행, 열에는 정수 위치 기반 값이 들어갑니다.
df = pd.DataFrame(
data=[
[1, 2, 3],
[4, 5, 6],
[7, 8, 9]
],
index=[1, 2, 3],
columns=["a", "b", "c"]
)
df.iloc[[1, 2], [1]]