AICE - 데이터 이해 3

이강민·2023년 8월 7일
0

AICE

목록 보기
8/18
post-thumbnail

시각화로 데이터 탐색하기

다변량 시각화 탐색하기

산점도

import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Clean_Dataset.csv', encoding = 'cp949')

plt.figure(figsize=(4,2))
plt.scatter(y=df['price'], x=df['duration'])
plt.xlabel('Duration')
plt.ylabel('Price')
plt.show()

히트맵

상관계수의 정보를 시각화함.

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Clean_Dataset.csv', encoding = 'cp949')
heat = df.corr()


plt.figure(figsize=(4,2))
plt.pcolor(heat)
#x축 항목 정보 표기
plt.xticks(np.arange(0.5, len(heat.columns),1), heat.columns)
#y축 항목 정보 표기
plt.yticks(np.arange(0.5, len(heat.index),1), heat.index)
#히트맵 확인을 위한 칼라바
plt.colorbar()
plt.show()

seaborn 시각화 라이브러리 활용

범주형 산점도

범주형 데이터와 수치형 데이터의 관계를 시각화할 수 있는 그래프

import pandas as pd
#import matplotlib.pyplot as plt
#import numpy as np
import seaborn as sns

df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Clean_Dataset.csv', encoding = 'cp949')
seaborns = sns.catplot(y="airline", x ="price", col='class', data = df)
#seaborn 라이브러리의 사이즈 조절
seaborns.fig.set_size_inches(5,1.5)

선형 회귀 모델 그래프

선형회귀 모델과 연관 있는 함수로 일반적인 산점도와 함께 직선의 회귀선을 그려주기 때문에 특성간의 선형적인 관계를 확인하기 쉬운 그래프

import pandas as pd
import seaborn as sns

df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Clean_Dataset.csv', encoding = 'cp949')
seaborns = sns.lmplot(y="price", x ="duration", data = df, line_kws={'color':'red'})
#seaborn 라이브러리의 사이즈 조절
seaborns.fig.set_size_inches(5,1.5) 

빈도 그래프

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt


df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Clean_Dataset.csv', encoding = 'cp949')
plt.figure(figsize=(4,2.5))
seaborns = sns.countplot(x ="airline", hue='class', data = df)

조인트 그래프

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt


df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Clean_Dataset.csv', encoding = 'cp949')
#plt.figure(figsize=(4,2.5))
seaborn = sns.jointplot(y="price", x="duration", data=df)
#seaborn 라이브러리의 사이즈 조절
seaborn.fig.set_size_inches(5,1.5)

히트맵

import pandas as pd
Jhkh
import seaborn as sns
import matplotlib.pyplot as plt




df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/Clean_Dataset.csv', encoding = 'cp949')
df.drop([df.columns[0]], axis=1, inplace=True)
df_eco = df[(df['class'] == 'Economy')]
plt.figure(figsize=(4,2))
sns.heatmap(df_eco.corr())

profile
배움은 끝없이

0개의 댓글