통계학은 무엇인가

yst3147·2022년 8월 5일

수리통계학

목록 보기
1/10

Wackerly et al., Mathematical Statistics with Applications을 읽고
책 내용을 정리하였습니다.

1.1 서론

통계학

  • 정의
    • 추론을 목적으로 하는 정보이론
  • 목적
    • 모집단에서 추출한 표본에 포함되어 있는 정보에 근거하여 모집단에 관한 추론을 하는 것
    • 그 추론의 적합성에 관련된 측도를 제공

모집단

우리의 관심 대상이 되는 전체 데이터의 집합

표본

모집단으로부터 선택한 부분집합

1.2 측정값들의 특성화 : 그래프적인 방법

구간 선택 가이드라인

  • 측정값이 분할하는 점에 속하지 않도록 측정값의 축을 세분화하는 점을 선택해야 함
  • 데이터의 범위가 확장되고 데이터의 양이 많아질수록 구간의 수를 더 크게 사용하는게 좋음

1.3 측정값들의 특성화 : 수치적인 방법

평균

  • n개의 측정값 y1,y2,...,yny_1, y_2, ..., y_n들에 대한 표본의 평균(mean) 수식

    yˉ=1ni=1Nyi\bar{y} = \frac{1}{n} \sum_{i=1}^N y_i

  • 대응되는 모집단 평균은 μ\mu로 나타냄
    -> 표본 정보를 이용하여 추정하고자 하는 미지의 상수

분산

  • 측정값 y1,y2,...,yny_1, y_2, ..., y_n들에 대한 표본의 분산(variance)은 측정값들과 그들 평균과의 차이의 제곱을 더하여 n-1로 나눈 것

  • 표본분산 수식
    s2=1n1i=1N(yiyˉ)2s^2 = \frac{1}{n-1} \sum_{i=1}^N (y_i - \bar{y})^2

  • 대응되는 모분산은 σ2\sigma^2로 나타냄

  • 측정값들의 집합에 대한 분산이 클수록 집합 내의 변동량도 커짐

표준편차

  • 측정값들의 표본에 대한 표준편차(standard deviation)은 분산의 양의 제곱근

  • 표본 표준편차 수식
    s=ss = \sqrt{s}

  • 모표준편차는 σ=σ2\sigma = \sqrt{\sigma^2}로 나타냄

  • 단일 측정값들의 집합에 대해 데이터 변동을 상당히 정확하게 묘사할 수 있도록 해줌

경험적 규칙

  • 근사적으로 정규분포(종모양)인 측정값들의 분포에 대해서는, 다음의 양 끝점을 갖는 구간에 대해 다음 사실이 성립

    • μ±σ\mu \pm \sigma는 측정값들의 약 68%를 포함
    • μ±2σ\mu \pm 2\sigma는 측정값들의 약 95%를 포함
    • μ±3σ\mu \pm 3\sigma는 거의 모든 측정값들을 포함

1.4 추론하는 방법

1.5 이론과 현실

1.6 요약

0개의 댓글