df.pivot(index='gender', columns='age', values='weight')
df.pivot(index='gender', columns='age')['weight]
# 남자 여자를 기준으로, 각 연령대에 대한 weight 찾기
#복수의 pivot column
df.pivot(index='gender', columns='age', values=['weight', 'address'])
# 남자 여자를 기준으로 ,각 연령대에 대한 무게와 주소 각각
pivot의 반대 개념으로, ID로 지정한 컬럼을 제외한 나머지 컬럼의 자료를 위에서 아래로 쌓는다.
id_vars 컬럼을 기준으로 원래 데이터에 있던 여러 개의 컬럼을 'variable' 컬럼에 쌓고, 'value' 컬럼에 ID와 variable에 해당하는 값을 넣어주는 식으로 재구조화
그러니까, id_vars를 제외한 컬럼들이 variable의 도메인이 되고, value에는 각 컬럼의 값이 저장됨
df.melt(id_vars=['index','column'])
df.melt(id_vars=['index','column', value_vars=['value_1']
6.sort 정렬하기
df.duplicated() # 결과는 boolean
df[df.duplicate()] # 중복된 데이터 조회
df.reset_index(drop=True, inplace=True) # 데이터의 인덱스를 리셋하기(중복행 빠지니깐)
df.drop_duplicates(ignore_index=True) # 중복된 데이터 제거