import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Clean_Dataset.csv', encoding = 'cp949')
plt.figure(figsize=(4,2))
plt.scatter(y=df['price'], x=df['duration'])
plt.xlabel('Duration')
plt.ylabel('Price')
plt.show()
상관계수의 정보를 시각화함.
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Clean_Dataset.csv', encoding = 'cp949')
heat = df.corr()
plt.figure(figsize=(4,2))
plt.pcolor(heat)
#x축 항목 정보 표기
plt.xticks(np.arange(0.5, len(heat.columns),1), heat.columns)
#y축 항목 정보 표기
plt.yticks(np.arange(0.5, len(heat.index),1), heat.index)
#히트맵 확인을 위한 칼라바
plt.colorbar()
plt.show()
범주형 데이터와 수치형 데이터의 관계를 시각화할 수 있는 그래프
import pandas as pd
#import matplotlib.pyplot as plt
#import numpy as np
import seaborn as sns
df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Clean_Dataset.csv', encoding = 'cp949')
seaborns = sns.catplot(y="airline", x ="price", col='class', data = df)
#seaborn 라이브러리의 사이즈 조절
seaborns.fig.set_size_inches(5,1.5)
선형회귀 모델과 연관 있는 함수로 일반적인 산점도와 함께 직선의 회귀선을 그려주기 때문에 특성간의 선형적인 관계를 확인하기 쉬운 그래프
import pandas as pd
import seaborn as sns
df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Clean_Dataset.csv', encoding = 'cp949')
seaborns = sns.lmplot(y="price", x ="duration", data = df, line_kws={'color':'red'})
#seaborn 라이브러리의 사이즈 조절
seaborns.fig.set_size_inches(5,1.5)
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Clean_Dataset.csv', encoding = 'cp949')
plt.figure(figsize=(4,2.5))
seaborns = sns.countplot(x ="airline", hue='class', data = df)
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Clean_Dataset.csv', encoding = 'cp949')
#plt.figure(figsize=(4,2.5))
seaborn = sns.jointplot(y="price", x="duration", data=df)
#seaborn 라이브러리의 사이즈 조절
seaborn.fig.set_size_inches(5,1.5)
import pandas as pd
Jhkh
import seaborn as sns
import matplotlib.pyplot as plt
df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Clean_Dataset.csv', encoding = 'cp949')
df.drop([df.columns[0]], axis=1, inplace=True)
df_eco = df[(df['class'] == 'Economy')]
plt.figure(figsize=(4,2))
sns.heatmap(df_eco.corr())