전처리 - index()

류소리·2023년 1월 6일
0

전처리

목록 보기
4/11

인덱스로 지정

  • df.set_index( " ",inplace=True)

특정 열 1개를 인덱스로 지정

-df.set_index('id')

열 2개 이상 멀티 인덱스 지정

  • df.set_index(['id', 'name'])

원하는 값들로 인덱스 구성

:. 리스트에 원하는 값들을 담은 뒤, pd.Index 함수로 인덱스 객체로 만들어 input으로 넣어주면 된다.

  • df.set_index(pd.Index(['1번', '2번', '3번', '4번']))

원하는 값을 포함하여 멀티 인덱스 구성

: 원하는 인덱스 객체, column의 이름을 넣은 리스트를 input으로 주면 됨.

  • df.set_index([pd.Index(['1번', '2번', '3번', '4번']), 'name'])

df.reset_index(inplace=True)

: 메서드는 설정 인덱스를 제거하고 기본 인덱스(0,1,2, ... , n)으로 변경하는 메서드 입니다.

print(df.reset_index())
>>
  index  col1  col2 # index라는 열이 생성되고 기존 인덱스가 기본 인덱스로 변경됨
0  row1     1     2
1  row2     3     4
2  row3     5     6
  • drop = True인 경우 열이 밖으로 꺼내지는게 아니라 완전히 삭제됩니다.
print(df.reset_index(drop=True))
>>
   col1  col2
0     1     2
1     3     4
2     5     6
  • inplace=True인 경우 원본이 변경되게 됩니다.
df.reset_index(inplace=True)
print(df)
>>
  index  col1  col2
0  row1     1     2
1  row2     3     4
2  row3     5     6

출처:
https://jimmy-ai.tistory.com/155
https://wikidocs.net/155404

profile
새싹 빅테이터 개발자

0개의 댓글