관심의 대상 을 관측하여 수집한 자료를 정리, 요약 하고 이를 바탕으로 일반화된 결론을 도출하는 학문관심대상 - 현상, 집단정리,요약 - 수치적 요약, 시각적 요약 (Data Visualization)관심대상 --> 모집단, 관측하여 수집한 자료 --> 표본수치적 요약
데이터 > - 관측을 통해 획득한 사실 - 논리의 기초가 되는 재료 어떤 결론의 근거가 될 수 있는 모든 사실 데이터 분석 > - 수집된 데이터로부터 의미있는 정보를 도출해 내는 과정 요약과 추정의 과정을 거침 요약 - 수집된 데이터를 일목요연하게 정리하는 것
평균 - Outlier에 민감$\\bar X = \\frac{1}{n} \\cdot \\sum\_{i=1}^{n}x_i$BigQuery에서는 AVG() 집계함수를 이용하여 쉽게 평균을 구할 수 있다.중위수/중앙값정렬된 자료에서 중앙에 위치한 값 (짝수일 경우 가운데 2
흩어짐, 변동관측값과 평균의 차이 제곱의 합분산 $s^2 = \\dfrac{1}{n-1} \\cdot \\sum\_{i=1}^{n}(X_i - \\bar X)^2$표준 편차 - root를 씌워 원자료의 단위와 동일하게 만듬$s = \\sqrt {s^2} = \\sqrt