질문 : 라면 제품군의 영양성분은 어떤 특성을 가지고 있을까?
라면 영양성분으로 EDA 실행
식품의약품안전처에서 관리하는 식품의약성분 데이터베이스에 있는 자료이다.
분석 데이터의 자료원 가공식품영양성분의 정보는 2021년에 최신화됐다.
ramen.head()
ramen.tail()
결측치가 ' - ' 라는 문자열로 표시되어 있다.
ramen_replaced = ramen.replace('-', 0)
' - ' 를 0으로 대체했다.
각 성분의 데이터 분포를 확인하기 위해 boxplot을 사용했다.
해석법 구체화 필요
f, ax = plt.subplots(figsize=(10,5))
boxplot = ramen_replaced.boxplot(column=['단백질(g)','지질(g)','탄수화물(g)','총당류(g)',
'나트륨(mg)','콜레스테롤(mg)','총 포화 지방산(g)'])
plt.savefig('/식품 영양 분석/ramen_boxplot.png')
f, ax = plt.subplots(figsize=(10,5))
boxplot = ramen_replaced.boxplot(column=['성분명'])
plt.savefig('/식품 영양 분석/성분명_boxplot.png')
높은 수치에 많이 집중해있다.
고른 분포이다.
이상치가 없고, 고른 분포이다.
높은 수치에 이상치가 집중됐다.
큰 이상치가 있다.
높은 수치에 이상치가 매우 집중됐다.
이상치가 조금 있지만 고른 분포이다.
!apt-get update -qq
!apt-get install fonts-nanum* -qq
path = '/usr/share/fonts/truetype/nanum/NanumBarunGothic.ttf'
font_name = fm.FontProperties(fname=path, size=50).get_name()
print(font_name)
plt.rc('font', family=font_name, size=11)
mpl.font_manager._rebuild()
mpl.rcParams['axes.unicode_minus'] = False
# 파일 내 전체 코드 실행 후 런타임 재시작 필요