범주형 변수의 기술통계에 대해 알아봅니다.
빈도수(count)
유일값(unique)
결측치(isnull, isna)
최빈값(top), 최빈값의 빈도수(freq)
describe(include="object")
데이터 및 라이브러리 로드
*라이브러리 로드
# 데이터 분석을 위한 pandas 라이브러리를 불러옵니다.
# 수치계산을 위한 numpy를 불러옵니다.
# 데이터 시각화를 위한 matplotlib, seaborn 을 불러옵니다.
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
*버전확인
print(pd.__version__) #1.3.5
print(sns.__version__) #0.11.2
*데이터셋 불러오기
# mpg 데이터셋을 불러옵니다.
# df
df = sns.load_dataset("mpg")
df.shape#(398,9)
*데이터셋 일부만 가져오기
# head
df.head()
# tail
df.tail()
*요약
df.info()
*결측치 보기
df.isnull().sum()
범주형 변수의 기술통계
# describe 를 통해 범주형 변수에 대한 기술통계를 보기
df.describe()
빈도수(count)
유일값(unique)
결측치(isnull, isna)
최빈값(top), 최빈값의 빈도수(freq)
describe(include="object)
df.describe(include="object")