[통계분석] 표본평균/표본분산, 중심극한정리/중심경향도, 정량적/정성적 데이터

주현·2023년 10월 30일

통계분석

목록 보기
1/3

1. 표본평균의 확률분포에 사용하는 분포와 표본분산의 확률분포에 사용하는 분포를 설명하라.


표본평균의 확률분포에 사용하는 분포는 정규분포이다. 정규분포는 평균이 μ이고 표준편차가 σ인 형태를 갖는 분포이다. 표본평균의 확률분포는 표본 크기가 커질수록 정규분포에 가까워지며 이는 중심극한정리에 의해 설명된다.

표본분산의 확률분포에 사용하는 분포는 자유도 n-1인 카이제곱분포이다. 카이제곱분포는 자유도가 증가함에 따라 정규분포에 가까워진다.


2. 중심극한정리의 정의와 중심경향도가 무엇인지 설명하고, 중심경향도를 나타내는 지표들의 개념을 설명하라.


  1. 중심극한정리
    중심극한정리란, 임의의 모집단으로부터 추출한 표본의 크기가 충분히 크면, 표본평균의 확률분포가 정규분포에 가까워진다는 정리이다. 중심극한정리는 표본평균을 이용한 추론을 가능하게 해준다.

  1. 중심경향도
    중심경향도는 데이터의 값이 모여있는 위치를 나타내는 지표이다. 중심경향도를 나타내는 지표로는 평균, 중위수, 최빈수가 있다.

    1) 평균
    평균은 데이터의 모든 값을 더한 후 데이터의 개수로 나눈 값이다.

    2) 중위수
    중위수는 데이터를 크기 순으로 나열했을 때 가운데 위치한 값이다.

    3) 최빈수
    최빈수는 데이터에서 가장 많이 나타나는 값이다.


3. 데이터는 정량적 데이터와 정성적 데이터로 구분할 수 있다. 정성적 데이터와 정량적 데이터에 속하는 척도를 각각 기술하라.


  1. 정량적 데이터
    정량적 데이터는 수치로 표현할 수 있는 데이터이다. 정량적 데이터의 척도로는 명목척도, 서열척도, 등간척도, 비율척도가 있다.

    1) 명목척도
    데이터를 구분하는 데 사용되는 척도이다. 예를 들어, 성별, 지역, 직업 등이 명목척도에 속한다.

    2) 서열척도
    데이터를 크기 순으로 나열할 수 있는 척도이다. 예를 들어, 학생의 성적, 상품의 등급 등이 서열척도에 속한다.

    3) 등간척도
    데이터의 상대적인 차이를 측정할 수 있는 척도이다. 예를 들어, 시험 점수, 온도 등이 등간척도에 속한다.

    4) 비율척도
    데이터의 절대적인 차이를 측정할 수 있는 척도이다. 예를 들어, 길이, 무게 등이 비율척도에 속한다.


  1. 정성적 데이터
    정성적 데이터는 수치로 표현할 수 없는 데이터이다. 정성적 데이터의 척도로는 범주척도가 있다.

    1) 범주척도
    데이터를 범주로 나누는 척도이다. 예를 들어, 고객의 만족도, 제품의 품질 등이 범주척도에 속한다.

profile
삽질 전문가

0개의 댓글