데이터분석 1-2

숨오·2022년 6월 25일

공부시간과 성적에 대한 데이터가 필요하다.

공부 시간이 높을수록 성적이 높아질까?에 대한 분석을 하려면

성적(=종속변수), 다른 요인들에 의해 결정되는 변수.
공부시간은 성적에 영향을 주는 변수이므로, 독립변수.

공부시간 * a + b = 성적

kaggle 사이트
데이터셋을 제공 & 데이터셋 분석결과를 제출하면 예측성공률을 보여주는 사이트

상관관계란?
변수 간의 관계.
공부시간이 높을 때 성적도 높다면, 공부 시간과 성적은 '양의 상관관계'에 있다고 한다.

반대로, 공부 시간이 적을 때 성적이 높다면 공부 시간과 성적은 '음의 상관관계'에 있다고 한다.

Google sheet > 확장 프로그램 > XLMiner Analysis ToolPak > Correlation 상관관계

Input Range: A:I
= A부터 I열까지 분석할 것

Labels in First Row 체크
= 첫 번째 행은 라벨이므로, 두 번째 행부터 분석을 할 것

Output Range: K:T
= 분석 결과값을 K부터 T열까지 보여줄 것

나란히 표시된 수치들 = 상관계수
상관계수란? 성적과의 연관 정도

이전 시험에서 실패한 적이 얼마나 있었는지?
이전 시험에서 어떤 성적을 받았는지?
가 가장 크게 연관이 되어있음을 알 수 있음

=> 우리의 직관과 어느 정도 일치하는 것을 확인할 수 있음

profile
자신감만땅

0개의 댓글