데이터 전처리에 중복된 행 또는 중복값을 확인하고 처리하는 작업이 필요하다. 중복 데이터(행)을 확인하기 위해 duplicated()를 사용하고, 중복값을 지우기 위해 drop_duplicates()를 쓰면 된다.
데이터 프레임이 커지면 눈으로 확인하기 어려우므로 중복 데이터가 있는지 확인해야 한다.
df.drop_duplicates()