import seaborn as sns
data = sns.load_dataset('tips')
df = pd.DataFrame(data)

df.head()
df.head(n)

df.tail()

df.info()

df.describe()

df2 = pd.DataFrame({
'A' : [1, 2, 3, 4],
'B': [5, 6, 7, None]
})

df2.isna()
df2.isnull()

df2.isna().sum()
df2.isnull().sum()

df2.dropna()

df2.fillna(값, inplace = True)
df2.fillnull(값, inplace = True)
# 중복 데이터 확인
df.duplicated(subset=['컬럼1', '컬럼2', '컬럼3'], keep = ___)
# 중복 데이터 제거
df.drop_duplicates(subset=['컬럼1', '컬럼2', '컬럼3'], keep = ___)
# IQR 계산
Q1 = df['컬럼1'].quantile(0.25)
Q3 = df['컬럼1'].quantile(0.75)
IQR = Q3 - Q1
# 이상치 기준 설정
lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR
# 이상치 제거
df[(df['컬럼1'] >= lower_bound) & (df['컬럼1'] <= upper_bound)]
df['total_bill'].dtype
결과: dtype('float64')
df.types

df['total_bill'] = df['total_bill'].astype(str)
df.info() # 확인

