huggingface의 datasets랑 맨날천날 헷갈리는 pandas
컬럼 이름 정정하는 방법이 두개임
1) columns에 냅다 때려박는 방법과 2) rename 함수로 dictionary로 바꾸는 방법이 있다.
일부만 바꿀 때는 후자가 좋고, 전체 다 변경하고자 할 때는 전자가 편하다.
print(df.columns)
# a, b, c, d
df.columns = ['A', 'B', 'C', 'D']
# inplace = True를 해줘야 원래 column 이름이 없어짐
df.rename({'a':'A', 'b':'B', 'c':'C', 'd':'D'}, inplace=True)