import pandas as pd
import numpy as np
import matplotlib as mlp
import seaborn as sns
import pandas_profiling as pp
import re
import matplotlib.font_manager as fm
mpl.font_manager._rebuild()
mpl.pyplot.rc('font', family='NanumBarunGothic')
fontpath = '/Users/crinex/Library/Fonts/NanumBarunGothic.ttf'
font = fm.FontProperties(fname=fontpath, size=9)
%config InlineBackend.figure_format = 'retina'
.isnull().sum()
.dtypes
.astype(int?,str?,float?)
.to_numeric(data, errors='coerce')
.describe()
.describe(include=[np.object])
해당 Feature를 가지고있는 모든 Records들을 출력
예를들어 부동산 데이터중 2020년(String)에 발생한 데이터들만 관찰
data_2020 = data[data['년'] == '2020']
.value_counts()
pd.options.display.float_format = '{:,.0f}'.format
data.groupby(data['년']).describe().T
'년'컬럼을 기준으로 나머지 수치 데이털의 통계적 수치를 전치하여 보여준다.