[통계 용어 정리] 기본 통계 용어

이재희·2021년 4월 16일
0

기본 통계 용어 정리

모집단(population)

  • 어떤 질문이나 실험을 위해 관심의 대상이 되는 개체나 사건의 집합
  • 전교남학생의 키

모수(parameter)

  • 모집단의 수치적인 특성
  • 키의 평균

표본(sample)

  • 모집단에서 선택된 개체나 사건의 집합

변량(variance)

  • 자료를 수량으로 나타낸 것를 수량으로 나타낸 것

도수(frequency)

  • 어떤 사건이 실험이나 관찰로부터 발생한 횟수
  • 표현방법 : 도수분포표,막대그래프(질적자료),히스토그램(양적자료),줄기잎그림

상대도수(relative frequency)

  • 도수를 전체 원소의 수로 나눈것

모평균(population mean,μ\mu)

  • 모집단 전체 자료의 평균

표본평균(sample mean,xˉ\bar x)

  • 모집단에서 추출한 표본의 평균

중앙값(median)

  • 평균은 극단값의 영향을 많이 받음
  • 자료를 순서대로 나열했을 때 가운데 오는 값
  • 자료의 수가 홀수인 경우 n+12\dfrac{n+1}{2}
  • 자료의 수가 짝수인 경우 n2\dfrac{n}{2}번째와 n+12\dfrac{n+1}{2}번째 자료의 평균

분산(variance)

  • 편차의 제곱의 합을 자료의 수로 나눈 값
    - 편차 : 값과 평균의 차이
  • 자료가 모집단일 경우 : 모분산
    σ2=1Ni=1N(xixˉ)2\sigma^2 = \dfrac{1}{N}\sum_{i=1}^N(x_i-\bar x)^2
  • 자료가 표본일 경우 : 표본분산
    σ2=1N1i=1N(xixˉ)2\sigma^2 = \dfrac{1}{N-1}\sum_{i=1}^N(x_i-\bar x)^2

표준편차(standard deviation)

  • 분산의 양의 제곱근

범위(Range)

  • 자료를 정렬하였을 때 가장 큰 값과 가장 작은 값의 차이

사분위수(quartile)

  • 전체 자료를 정렬하였을 때 1/4,1/2,3/4 위치에 있는 숫자
    - Q1 제 1 사분위수 1/4 위치
    - Q3 제 3 사분위수 3/4 위치

사분위수범위(IQR,inter quartile range)

  • Q3 - Q1

Z-score

  • 어떤 값이 평균으로 부터 몇 표준편차 떨어져 있는지 의미하는 값

  • 모집단의 경우 : z=xμσz = \dfrac{x - \mu}{\sigma}

  • 표본일 경우 : z=xxˉsz = \dfrac{x - \bar x}{s}

profile
오늘부터 열심히 산다

0개의 댓글