duplicated()는 중복되는 값들 중 첫번째 값은 중복이 아니라고 판단하고 그 다음 값 부터 중복이라고 판단함.
**airbnb_df.duplicated()** // 모든 데이터가 중복일때 중복되는 데이터에 True.중복되는 값들 중 첫번째는 False

**airbnb_df.duplicated().sum()** //중복값의 갯수

**airbnb_df[airbnb_df.duplicated()]** // 중복되는 열의 값만 보여줌

**airbnb_df[airbnb_df.duplicated(subset='id')]** // column중 id 값만 중복되는 값을 보여줌

**airbnb_df[airbnb_df.duplicated(subset=['id','n_reviews','price'])]** //id , price column이 중복되는 열을 보여줌.

**airbnb_df[airbnb_df.duplicated(subset='id', keep='first')]** // keep의 기본값은 first. 중복값중 첫번째 값을 False로 한다.

**airbnb_df[airbnb_df.duplicated(subset='id', keep='last')]**//중복값중 마지막 값을 False로 한다.

**airbnb_df[airbnb_df.duplicated(subset='id', keep=False)]**// 어느 컬럼이든 겹치는 값은 모두 보여준다

데이터프레임에서 중복값을 식별하고 제거하는 데 사용되는 Pandas 함수인 drop_duplicates
핵심 주제
데이터프레임에서 중복값을 식별하고 제거하는 데 사용되는 Pandas 함수인 drop_duplicates의 기능과 사용 방법에 대해 설명한다.
**airbnb_df.drop_duplicates()** //삭제. 기본적으로 모든 컬럼 값이 동일해야 중복으로 간주된다.
