kaggle Food choices 분석

라녕라녕·2022년 1월 3일
0

Data_Analyst

목록 보기
1/1
post-thumbnail

과일의 맛과 다른 요소들의 상관관계

일조량*a+b=과일의 맛

  • 과일의 맛 : 종속변수 = 다른 요인들에 의해 결정되는 변수
  • 일조량 : 독립변수 = 종속변수가 결정되도록 영향을 주는 변수

상관관계

  • 일조량이 높을 때 과일의 맛이 좋다면 : 양의 상관관계
  • 일조량이 낮을 때 과일의 맛이 좋다면 : 음의 상관관계

데이터 분석 예제

캐글의 Dataset을 사용하여 상관관계 분석을 해보았다.
사용한 툴은 Google Docs의 XLMiner Analysis ToolPak.

https://www.kaggle.com/borapajo/food-choices

위 Dataset은 대학생들의 음식 선호도와 다양한 지표(성적, 소득, 주거환경 등)를 조사한 결과이다.

대학생의 요리빈도를 종속변수로 하여 관계가 있을 것으로 생각되는 지표를 주관적 선택 가공 후 직접 분석해보았다.

독립변수

  • Gender : 성별 (1 - 여성 and 2 - 남성)

  • parents_cook : 부모님의 주간 요리빈도
    1 - never
    2 - on holidays only
    3 - 1-2 times a week
    4 - 2-3 times a week
    5 - Almost everyday

  • exercise : 주간 운동 빈도
    1 – Never
    2 - Sometimes
    3 - Once a week
    4 - Twice or three times per week
    5 - Everyday

  • fruit_day : 일일 과일 섭취 정도
    1 - very unlikely
    2 - unlikely
    3 - neutral
    4 - likely
    5 - very likely

  • eating_out : 주간 외식 빈도
    1 - Never
    2 - 1-2 times
    3 - 2-3 times
    4 - 3-5 times
    5 - every day

종속변수

  • cook : 요리빈도
    1 - Never, I really do not know my way around a kitchen
    2 - I only help a little during holidays
    3 - Whenever I can, but that is not very often
    4 - A couple of times a week
    5 - Every day

가공된 Dataset

  • nan 등의 n/a, null 데이터는 제외함

분석방법

결과


부모의 요리 빈도성별이 답변자의 요리빈도와 상관관계가 높았음을 알 수 있었다. 😊

profile
데이터..분석중..삐릭삐릭

0개의 댓글