[pandas] unique, nunique

yh o·2024년 5월 15일

[pandas] 코드 정리하기

목록 보기

2/4

import pandas as pd
df =  pd.DataFrame({'col1':[1,1,1,1,1,1,1,1,1,2,2,2,2,3,3,1], 
               'col2':['A','A','A','B','B','B','B','D', 'D','C', 'C', 'A','A','A',None,None]})

[ unique ]

고유한 값 목록 출력

df['col2'].unique()
> array(['A', 'B', 'D', 'C', None], dtype=object)

df['col2'].dropna().unique() #NA 제외
> array(['A', 'B', 'D', 'C'], dtype=object)

[ nunique ]

고유한 값 개수 출력 (NA 제외)

df['col2'].nunique()
> 4
df['col2'].nunique(dropna=False) #NA포함
> 5

yh o

이전 포스트

[pandas] value_counts

다음 포스트

[pandas] unique, nunique

[pandas] 코드 정리하기

[ unique ]

[ nunique ]

[pandas] value_counts

[pandas] 메모리 관리를 위한 대용량 데이터프레임 다루기

0개의 댓글