판다스 인덱싱 사용하기

skyepodium·2020년 5월 2일
0

참고: 머신러닝 완벽가이드

1. 인덱싱 연산자

판단스에는 인덱싱을 지원하는 3개의 연산자가 있습니다.

  1. [] 연산자
  2. iloc[]
  3. loc[]
  4. ix[] - 삭제

2. [] 연산자

1) 정의

  1. 데이터프레임에 사용되는 [] 연산자는 넘파이 또는 series의 []연산자와 쓰임이 다릅니다.

  2. []의 입력값은 칼럼명(칼럼 리스트) 또는 불린 인덱스 용도로만 사용해야합니다.

  3. [0:2]와 같은 슬라이싱 연산으로 데이터 추출은 지양합니다.

2) 사용법

[]에는 칼럼명 또는 불린 인덱스가 들어갑니다.

행, 열의 구분이 없습니다.

3) 예시

df = pd.DataFrame(
    data=[
        [1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]
    ],
    index=[1, 2, 3], 
    columns=["a", "b", "c"]
)

df["b"]

df[["b", "c"]]

df[df["b"] > 2]

3. 명칭 기반 인덱싱, 위치 기반 인덱싱

명칭 기반 인덱싱 - 인덱스나 칼럼명으로 데이터 접근
위치 기반 인덱싱 - 행, 열의 위치 좌표로만 데이터 접근

4. loc[]

1) 정의

명칭 기반 인덱스 연산자

2) 사용법

행 - 인덱스
열 - 칼럼명

3) 예시

df = pd.DataFrame(
    data=[
        [1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]
    ],
    index=[1, 2, 3], 
    columns=["a", "b", "c"]
)

df.loc[[1, 2], "b"]

5. iloc[]

1) 정의

위치 기반 인덱스 연산자

2) 사용법

행, 열에는 정수 위치 기반 값이 들어갑니다.

3) 예시

df = pd.DataFrame(
    data=[
        [1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]
    ],
    index=[1, 2, 3], 
    columns=["a", "b", "c"]
)

df.iloc[[1, 2], [1]]
profile
callmeskye

0개의 댓글