sns.set_styple('white')
sns.set_color_codes(palette='deep')
f, ax = plt.subplots(figsize=(8,7))
# check the new distribution
sns.distplot(data['SalePrice'], color='b') # 그래프 데이터 및 색상
ax.xaxis.grid(False) # 세로 격자선 없음
ax.set(ylabel='Frequency') # y축 이름
ax.set(xlabel='SalePrice') # x축 이름
ax.set(title='SalePrice distribution') # 그래프 이름
sns.despine(trim=True, left=True) # 테두리 속성
plt.show()
실행결과
sns.set_style('white')
sns.set_color_codes(palette='deep')
f, ax = plt.subplots(figsize=(8,7))
# Check the new distribution
sns.distplot(np, log1p(data['SalePrice']), color='b') # log(1+x) 변환
ax.xaxis.grid(False) # 세로 격자선 없음
ax.set(ylabel='Frequency')
ax.set(xlabel='SalePrice')
ax.set(title='SalePrice distribution')
sns.despine(trim=True, left=True)
plt.show()
실행결과
data['BsmtFinType1'].unique()
data['BsmtFinType1_ALQ'] = 1 * (data['BmstFinType1']=='ALQ') # BmstFinType1 요소가 ALQ인지 확인하는 column 추가
data['BsmtFinType1_ALQ'].unique() # BmstFinType1_ALQ는 0과 1로 구성됨
실행결과
data['WoodDeckSF'].unique()
data['HasWoodDeck'] = (data['WoodDeckSF'] > 0) * 1 # WoodDeck공간이 있는지 확인
data['HasWoodDeck'].unique() # HasWoodDeck은 0과 1로 구성됨
실행결과
data['YrSold'].head(5) # 팔린 날짜
data['YearRemodAdd'].head(5) # 리모델링 한 날짜
data['YearSinceRemodel'] = data['YrSold'].astype(int) - data['YearRemodAdd'].astype(int)
data['YearSinceRemodel'].head(5)
실행결과
data['OverallQual'].unique() # 전반적인 마감 퀄리티
data['OverallCond'].unique() # 전반적인 상태 퀄리티
data['Total_Home_Quality'] = data['OverallQual'] + data['OverallCond']
data['Total_Home_Quality'].unique()
실행결과