통계 용어/개념 짧은 정리(-ing)

chang·2021년 1월 8일
0

확률질량함수 vs 확률밀도함수

  • 확률질량함수(pmf) ~ 이산형
  • 확률밀도함수(pdf) ~ 연속형

표준편차, 표준오차, 표본오차

  • 표준편차(Standard Deviation)

    주어진 자료의 퍼진 정도, 분산\sqrt{분산}

  • 표본표준편차

    표본의 표준편차(ss), 표본자료의 퍼진 정도 , 표본분산(s2)\sqrt{표본분산(s^2)}

  • 표준오차(Standard Error, s.e.)

    표본평균의 표준편차, 표본평균의 퍼진 정도, 표본평균(Xˉ)분산\sqrt{표본평균(\bar X)의 \:분산}

    Var(Xˉ)\sqrt{Var(\bar X)} = Var(1ni=1nXi)\sqrt{Var(\frac{1}{n}\sum\limits_{i=1}^nX_i)} = 1n2nVar(Xi)\sqrt{\frac{1}{n^2}\cdot n \cdot Var(X_i)} =1ns2=sn\sqrt{\frac{1}{n}\cdot s^2} = \frac{s}{\sqrt{n}}

  • (확률)표본오차(random sampling error) = 오차한계
    표본으로부터의 모수 추정치와 실제값의 차이/최대 허용된 오차/오차범위
    임계값*표준오차로 계산되며 유의수준 혹은 신뢰수준이 정해진다면 표본오차로부터 적절한 표본크기의 값을 찾을 수도 있다.


편차, 오차, 잔차

  • 편차(Deviation) : 관측치와 평균의 차이
  • 오차(Error) : 추정값과 실제값의 차이 in 모집단의 모형
  • 잔차(Residual) : 추정값과 실제값의 차이 in 표본의 모형

가설검정 용어

  • p-value

    유의확률, 영가설을 기각할 수 있는 유의 수준의 최소값(?) ~> 귀무가설 하에서 구한 검정통계량의 값보다 더 극단값이 나올 확률 정도로 이해했다.

  • 유의수준(α\alpha)

    1종 오류를 범할 확률로 P(reject H0_0|H0_0 is true) ~> 영가설 맞는데 틀리다 할 확률

  • 신뢰수준(1-α\alpha)

    영가설 맞는데 맞다 할 확률 정도

  • 기각역

    H0H_0 true 전제 하에 구한 검정통계량의 분포에서 계산된 검정통계량이 속할 확률이 유의수준 α\alpha인 영역
    위치는 대립가설의 형태에 따라 결정되며 형태는 유의수준 α\alpha에 의해 결정됨

  • 임계값(critical value)

    기각역의 시작점
    H0H_0 true 전제 하에 구한 검정통계량의 분포에서 계산된 검정통계량이 임계치보다 극단인지(기각역에 속하는지) 아닌지를 비교해 가설검정 이루어지는 기준

0개의 댓글