import pandas as pd
df = pd.DataFrame({'col1':[1,1,1,1,1,1,1,1,1,2,2,2,2,3,3,1],
'col2':['A','A','A','B','B','B','B','D', 'D','C', 'C', 'A','A','A',None,None]})
고유한 값 목록 출력
df['col2'].unique()
> array(['A', 'B', 'D', 'C', None], dtype=object)
df['col2'].dropna().unique() #NA 제외
> array(['A', 'B', 'D', 'C'], dtype=object)
고유한 값 개수 출력 (NA 제외)
df['col2'].nunique()
> 4
df['col2'].nunique(dropna=False) #NA포함
> 5