기술통계란? - 수집한 데이터를 요약하고 묘사 설명해서 내린 통계 기법
기술통계 기법 2가지 - 집중화 경향와 분산도
집중화 경향(Central tendency) : 수집한 데이터에서 대표하는 값이 무엇인지 또는 어떤 값에 집중되어 있는지를 다루는 기법.
ex) 평균(mean), 중앙값(median), 최빈값(mode)
분산도(Variation) : 데이터가 전반적으로 어떻게 분포,분산되어 있는지(뭉쳐있는지, 퍼져있는지) 설명하는 방법.
ex) 표준편차(standard deviation),사분위(quartile)
기술통계 기법을 통해 수집한 데이터의 전체적인 모양을 그릴 수 있다. 데이터의 대표값은 무엇인지, 혹은 분산을 통해 편차가 얼마나 큰지 등.
파이썬 코드 : df.describe()
추리통계란? - 수집한 데이터를 바탕으로 어떤 것을 추론하고 예측하는데 사용하는 통계 기법
ex) 대통령선거 - 누가 당선 될 것인가에 대한 예측 (확률)
추리통계 기법 - 전체집단에서 표본을 샘플링 후 통계를 내려 추론,추리
t-test , chi-square test 등을 사용
한마디로 기술통계란 평균,중앙값,최빈값,표준편차,사분위 등으로 있는 사실에 대해 통계를 내린 것! 추리통계는 더 나아가 기술통계를 바탕으로 알고자 하는 사실을 추론하고 예측!