오늘은 사둔 책들이 좀 있어서, 그것들을 빠르게 다 읽고 토치는 그래도 앞으로 계속 사용할 거라서 기본적인 구조들을 정리하는 작업도 하려고 한다.
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
sns.set(font_scale = 1.1)
sns.set_style('ticks')
sns.pairplot(df, diag_kind = 'kde')
plt.show()
df.cov(numeric_only = True)
sns.heatmap(df.corr(method = 'pearson'), cmap = 'viridis')
mask = np.triu(np.ones_like(df.corr(numeric_only = True), dtype = np.bool))
fig, ax = plt.subplots(figsize = (15,10))
sns.heatmap(df.corr(numeric_only = True), mask = mask, vmin = -1, vmax = 1, annot = True, cmap = 'RdYlBu_r", cbar = True)
ax.set_title('Wine Quality Correlation', pad = 15)
df.groupby("groupby 대상 변수")["sum할 변수"].sum().reset_index()
df.groupby("groupby 대상 변수").count().reset_index()
sns.boxplot(y = {변수})
import missingno as msno
msno.matrix(df)
plt.show() #결측치가 어디에 있는지 시각적으로 표현
msno.bar(df)
plt.show() #결측값 막대그래프
df.dropna(how = {all, any}, subset = [{특정컬럼}], thresh = {최소 n개 이상의 컬럼이 결측값인 행})
pd.get_dummies(data = df, columns = ['ColA'], drop_first = True, dummy_na = True)

세부 링크