indexing & sorting

정민·2024년 2월 28일

데이터분석

목록 보기
5/11

1. Index


  • 인덱스(Index) : 행을 구별하는 데 사용되는 고유한 식별자
df.set_index('col1', inplace=True) # index 지정
df.reset_index(inplace=True) # 기본 정수 Index
# taxis
import seaborn as sns

df= sns.load_dataset('taxis')
df.head(2)


df.set_index('color', inplace =True)
# color 컬럼을 인덱스로 지정
df.head(2)

# 인덱스를 다시 기본 정수 인덱스로 변경하고 싶다!
df.reset_index(inplace=True)



2. Sort


  • 특정 기준에 따라 순서대로 나열
  • sort_values() : 특정 column 기준
df.sort_values('col1', ascending=False, inplace=True)
  • ascending =False : 내림차순
  • ascending = True : 오름차순

sort_index() : index 기준

df.sort_index(inplace=True)
df.sort_values('distance', ascending=False, inplace=True)
df.head(5)

profile
데이터 공부하는 예비 데이터 분석가, 김정민입니다.

0개의 댓글