[28일차]DataFrame기초 - 인덱스 제어

김준석·2024년 1월 4일

인덱스를 제어하는 함수와 인자를 살펴보자

**set_index, reset_index, drop=**

실습 환경 구성

import pandas as pd

cols = ['Released_Year', 'Genre','Series_Title','Director','Meta_score', 'IMDB_Rating','No_of_Votes','Certificate','Gross']

movie_df = pd.read_csv('imdb_top_1000.csv')
movie_df = movie_df[cols]
movie_df


.set_index()

  • 인덱스를 세팅하는 메소드
  • 특정 열을 인덱스로 설정하는 기능을 제공

‘Series_Title’ 컬럼을 인덱스로 세팅해보자

movie_df.set_index('Series_Title')

wow~~

컬럼이 인덱스로 이동하는 개념이기 때문에 Series_Title 는 컬럼에서 지워짐.

하지만 안지워지게 하는 방법이 존재한다!

.set_index() 의 drop= 인자

.set_index() 메소드에서는 drop=True가 default 값이다.

때문에 drop=False를 작성해주면 컬럼이 삭제되지 않는다.

movie_df.set_index('Series_Title',drop=False)

바꿔진 인덱스를 원본데이터에 저장!

movie_df = movie_df.set_index('Series_Title')

인덱스의 이름을 바꿔보자! df.index.name=

movie_df.index 를 이용하여 인덱스 정보를 확인해보면 아래와 같다.

name은 Series_Title 로 되어있는데 이를 ‘Title’로 변경해보자.

아주 간단하게 아래와 같이 진행하면 된다.

movie_df.index.name = 'Title'
movie_df


.reset_index()

  • 인덱스를 초기화한다.
movie_df.reset_index()

인덱스였던 Title 이 컬럼으로 들어가게 되었다!!!!!


index_col = 파일을 읽어올때 인덱스 지정

27일차 과제에서 수행했던 인자값이다!

movie_df = pd.read_csv('imdb_top_1000.csv',usecols = cols, index_col = 'Series_Title')
movie_df

이렇게 하면 처음부터 Series_Title를 인덱스 값으로 가져오게 된다.

0개의 댓글