통계 데이터 분석

sy_healing·2022년 4월 21일
0

통계

목록 보기
1/10

💡 통계 데이터 분석?

  • 수집된 데이터를 이용하여 유용한 정보를 도출하는 분석을 말한다.
    크게 기술 통계(Descriptive Statistics)와 추론 통계(Inferential statistics)로 나뉜다.

✍️ 기술 통계 분석

  • 모집단의 특성을 한 눈에 파악할 수 있도록 데이터를 요약, 정리해서 표현하는 방법
  • Box Plot, Violin plot 을 통해 시각화하여 볼 수 있다.

  • 기술 통계 사용 시 주의할 점
    : 많은 데이터를 몇 개의 통계치로 단순화 하면서 정보의 손실이 발생할 수 밖에 없다. 또한, 분석자에 따라 데이터의 요약 방식이 달라진다. 이를 잘 이해하고 있어야 통계를 근거로 적절한 의사결정을 할 수 있다.

📖 Python

# 파이썬을 통해서 기술 통계치를 나타내는 방법

import pandas as pd
df = dp.DataFrame({'a' : [1,2,3,4,5],
				   'b' : [2,4,6,8,10]}

df.describe()

✍️ 추론 통계 분석

  • 모집단에 대한 조사가 불가능하거나 비효율적일 때, 모집단 일부(표본)만을 관측하여 모집단의 특성을 추측하는 분석이다.
  • 추론통계 분석은 모집단에 대한 가설을 통계적으로 검정하거나, 모집단의 통계치를 추정한다.

예를 들어 여론조사, 정당의 지지도 조사를 할 때, 모든 유권자에게 의견을 묻는 것은 비용이 상당하므로, 일정 수의 유권자에게만 의견을 물어 전체 유권자의 지지도를 추측한다. (출구조사)

모집단에서 표본을 샘플링 하는 방법 중 대표적인 4가지는 다음과 같다.

0개의 댓글