라면 제품군 영양성분 EDA

Tae·2022년 4월 17일
0

질문 : 라면 제품군의 영양성분은 어떤 특성을 가지고 있을까?

라면 영양성분으로 EDA 실행

EDA

데이터 출처에 대한 설명

식품의약품안전처에서 관리하는 식품의약성분 데이터베이스에 있는 자료이다.
분석 데이터의 자료원 가공식품영양성분의 정보는 2021년에 최신화됐다.

행열 구성 확인

ramen.head()
ramen.tail()

결측치가 ' - ' 라는 문자열로 표시되어 있다.

1. 결측치 처리

ramen_replaced = ramen.replace('-', 0)

' - ' 를 0으로 대체했다.

2. boxplot

각 성분의 데이터 분포를 확인하기 위해 boxplot을 사용했다.
해석법 구체화 필요

f, ax = plt.subplots(figsize=(10,5))
boxplot = ramen_replaced.boxplot(column=['단백질(g)','지질(g)','탄수화물(g)','총당류(g)',
										'나트륨(mg)','콜레스테롤(mg)','총 포화 지방산(g)'])
plt.savefig('/식품 영양 분석/ramen_boxplot.png')

전체 성분

f, ax = plt.subplots(figsize=(10,5))
boxplot = ramen_replaced.boxplot(column=['성분명'])
plt.savefig('/식품 영양 분석/성분명_boxplot.png')

단백질

높은 수치에 많이 집중해있다.

지질

고른 분포이다.

탄수화물

이상치가 없고, 고른 분포이다.

총당류

높은 수치에 이상치가 집중됐다.

나트륨

큰 이상치가 있다.

콜레스테롤

높은 수치에 이상치가 매우 집중됐다.

총 포화 지방산

이상치가 조금 있지만 고른 분포이다.

* 폰트문제해결법

!apt-get update -qq 
!apt-get install fonts-nanum* -qq

path = '/usr/share/fonts/truetype/nanum/NanumBarunGothic.ttf' 
font_name = fm.FontProperties(fname=path, size=50).get_name()
print(font_name)
plt.rc('font', family=font_name, size=11)

mpl.font_manager._rebuild()
mpl.rcParams['axes.unicode_minus'] = False

# 파일 내 전체 코드 실행 후 런타임 재시작 필요
profile
프론트엔드 개발자

0개의 댓글