공부시간과 성적에 대한 데이터가 필요하다.
공부 시간이 높을수록 성적이 높아질까?에 대한 분석을 하려면
성적(=종속변수), 다른 요인들에 의해 결정되는 변수.
공부시간은 성적에 영향을 주는 변수이므로, 독립변수.
공부시간 * a + b = 성적
kaggle 사이트
데이터셋을 제공 & 데이터셋 분석결과를 제출하면 예측성공률을 보여주는 사이트
상관관계란?
변수 간의 관계.
공부시간이 높을 때 성적도 높다면, 공부 시간과 성적은 '양의 상관관계'에 있다고 한다.
반대로, 공부 시간이 적을 때 성적이 높다면 공부 시간과 성적은 '음의 상관관계'에 있다고 한다.
Google sheet > 확장 프로그램 > XLMiner Analysis ToolPak > Correlation 상관관계

Input Range: A:I
= A부터 I열까지 분석할 것
Labels in First Row 체크
= 첫 번째 행은 라벨이므로, 두 번째 행부터 분석을 할 것
Output Range: K:T
= 분석 결과값을 K부터 T열까지 보여줄 것

나란히 표시된 수치들 = 상관계수
상관계수란? 성적과의 연관 정도
이전 시험에서 실패한 적이 얼마나 있었는지?
이전 시험에서 어떤 성적을 받았는지?
가 가장 크게 연관이 되어있음을 알 수 있음
=> 우리의 직관과 어느 정도 일치하는 것을 확인할 수 있음