데이터 프레임 시각화하기

수현·2024년 1월 10일
1

Python

목록 보기
7/12

Bar plots 만들어보기

df.plot(kind='bar)

# 데이터 훑어보기
print(avocados.head())

         date          type  year  avg_price   size     nb_sold
0  2015-12-27  conventional  2015       0.95  small  9626901.09
1  2015-12-20  conventional  2015       0.98  small  8710021.76
2  2015-12-13  conventional  2015       0.93  small  9855053.66
3  2015-12-06  conventional  2015       0.89  small  9405464.36
4  2015-11-29  conventional  2015       0.99  small  8094803.56

# 아보카도의 사이즈별 판매량 합계 구하기
nb_sold_by_size = avocados.groupby("size")['nb_sold'].sum()
nb_sold_by_size

# bar plot 만들기
nb_sold_by_size.plot(kind='bar')

# 결과 확인하기
plt.show()

line plots 그리기

df.plot(x='date', y='weight_kg', kind='line')

# 날짜별 판매량 합계 구하기
nb_sold_by_date = avocados.groupby('date')['nb_sold'].sum()

# line plot 만들기
nb_sold_by_date.plot(x= 'date', y='nb_sold', kind='line')

# 결과 확인하기
plt.show()

Scatter plots 그리기

df.plot(x='', y='', kind='scatter', title='')

# avg_price 와 nb_sold의 Scatter plot (제목도 추가) 
avocados.plot(x='nb_sold', y='avg_price', kind='scatter', title="Number of avocados sold vs. average price")

# 결과 확인하기
plt.show()

Histograms

.hist()

# conventional avg_price의 히스토그램
avocados[avocados['type'] == 'conventional']['avg_price'].hist()

# organic avg_price으 히스토그램
avocados[avocados['type'] == 'organic']['avg_price'].hist()

# legend 추가하기
plt.legend(['conventional', 'organic'])

# 결과 확인하기
plt.show()

빈과 투명도 추가하기

# 투명도는 0.5, bin을 20으로 설정
avocados[avocados["type"] == "conventional"]["avg_price"].hist(alpha=0.5, bins=20)

# 투명도는 0.5, bin을 20으로 설정
avocados[avocados["type"] == "organic"]["avg_price"].hist(alpha=0.5, bins=20)

# legend 추가하기
plt.legend(["conventional", "organic"])

# 결과 확인하기
plt.show()

profile
데이터 분석 공부중:)

0개의 댓글