통계의 이해 2

yejubi1531·2022년 7월 3일
0

추정

통계적 추론 : 표본으로 부터 얻은 결과를 이용하여 모집단의 특성을 예측하는 과정

의문점들에 대해 알고 싶은 것은 모집단의 모수(모집단 평균, 표준편차)이나, 전수조사는 조사시간과 비용 등의 여러 문제로 인해 많은 어려움이 있고, 어떤 경우에는 조사 자체가 불가능한 경우도 발생하므로 모집단으로부터 선택한 일부분의 구성단위인 표본을 선택하고, 표본의 결과(표본평균, 표본분산 등)를 토대로 모집단의 성격과 특성을 파악하고자 함

통계적 추론추정(estimation)가설검정(hypothesis testing)으로 분류

추정(estimation)은 모집단에서 추출한 표본의 결과를 이용하여 모집단의 모수를 추측하는 과정을 말하며 추정방법에는 점추정(point estimation)구간추정(interval estimation)이 있음

  • 점추정: 오직 하나의 값으로 모수를 추정하는 것
  • 구간추정: 모수가 포함될 것이라고 기대하는 범위(모수의 신뢰구간)를 추정하는 것

추정량(estimator): 모집단의 모수를 추정하기 위해 사용하는 공식이나 함수식
추정치(estimate): 추정량이라는 공식에 실제 표본의 데이터를 대입하여 계산된 결과 값
표본 통계량: 표본으로부터 얻어진 표본평균( ), 표본분산(S2)을 의미

점추정

오직 하나의 값으로 모집단의 특성을 추정

오직 하나의 값으로 모수를 추정하기 때문에, 따라서 모집단의 평균(μ)을 추정하기 위한 추정량으로 표본평균, 표본 중앙값, 표본 최빈값을 생각할 수 있는데 이러한 추정량 중에서 선택을 하기 위한 기준이 있어야 함

모집단의 크기가 비교적 작을 경우에는 모집단 전체를 조사하는 전수조사(census)를 통하여 정확
한 모집단 평균을 알아 낼 수 있지만, 대부분의 경우 모집단 전체를 조사한다는 것은 불가능한 일
이므로 정확한 모평균은 알 수 없음

구간추정

모집단의 평균이 있을 만한 구간을 추정

점추정과는 달리 모수가 포함될 것이라고 기대하는 범위를 설정하여 모수를 추정하는 방법.
따라서 모집단 평균 μ에 대한 구간추정은 다음과 같이 μ를 중심으로 일정한 간격으로 추정하는 것


가설 검증

표본으로 부터 얻은 결과를 이용하여 모집단의 특성을 예측하는 과정을 통계적 추론이라 하며 통계적 추론은 추정과 가설검정(hypothesis testing)을 포함

통계적 가설검정은 표본분포를 이용하여 모집단 특성에 대한 가설의 진위를 가리는 것으로 실제 재판과정과 흡사한 면이 있음

  • 가설은 증명(검정)되지 않은 주장

  • 통계적 가설의 검정은 증명된 바 없는 주장을 귀무가설(nullhypothesis)이라는 틀 속에 집어넣고, 표본을 추출한 뒤 표본통계량을 이용하여 귀무가설을 테스트하는 과정이다.

  • 귀무가설은 많은 경우 주로 부정적인 생각을 반영한다. 통계적 가설검정에서는 귀무가설만을 테스트, 즉 통계적 분석을 시도한다. ‘효과가 없다’, ‘기대에 미치지 못한다’ 등의 부정적 시각을 반영하는 귀무가설을 기각함으로써 긍정적 결론을 유도

  • 즉, 연구자는 부정적 내용을 담고 있는 귀무가설을 통계적으로 검정하고 가능한 한 기각한 뒤, 긍정적인 내용을 담고 있는 또 하나의 가설인 대립가설(alternative hypothesis)을 받아들이기를 원한다.

  • 대립가설의 내용을 직접 테스트하여 본인이 원하는 긍정적인 결과를 이끌어내는 방법은 사용할 수 없다.


재판과정과 판결의 의미

재판은 법원에서 법적 판단을 내리는 절차

재판은 용의자에 대해 죄를 입증할 충분한 증거가 나타나지 않을 때까지 무죄임을 가정한 상태에서 이루어지며, 용의자는 자신의 이익을변론할 변호사를 선임할 권리를 갖는다.

재판과정에서 검사“용의자는 무죄”가 아님을 밝히는 자료를 제시하고,
변호사검사의 공격으로부터 용의자의 이익을 옹호하고, “용의자는 무죄”임을 변론한다.

용의자에 대한 법원의 “무죄 판결”은 용의자가 무죄임을 증명한 것이 아니라, 판사가 여러 판단 기준(검사의 증거, 변호사의 변론, 정황, 법조문과 판례 등)으로 볼 때 “용의자가 무죄가 아니라는 것을 밝히기에 충분한 타당성이 없다”는 것이다.

반대로 용의자에 대한 법원의 “유죄 판결”은 용의자가 유죄임을 증명한 것이 아니라, 판사가 여러 판단 기준(검사의 증거, 변호사의 변론, 정황,법조문과 판례 등)으로 볼 때 “용의자가 무죄가 아니라는 것을 밝히기에 충분한 타당성이 있다”는 것이다.

만약 판사의 무죄 또는 유죄 판결이 무죄 또는 유죄을 증명한 것이라면 재판의 결과에 불복하여 행해지는 항소나 상소와 같은 추가적인 절차는 존재하지도, 필요하지도 않을 것이다.

결국 판사는 용의자가 무죄라고 가정한 상태에서 재판을 하지만, 판결은 “무죄가 아님”을 밝히려는 모든 자료에 대해서 충분히 타당한 근거가 있는가에 따라 죄의 유무를 가린다고 볼 수 있다.


재판과 통계적 가설검증의 비교

어느 기업에서 생산한 충전 밧데리의 예를 들어 통계적 가설검정을 설명해보겠다.

스마트 폰의 밧데리를 생산하는 기업에서 충전시간을 향상시키기 위해 밧데리에 신 물질을 넣는 새로운 공법을 시도했다고 가정해보자

이 공법에 의해 충전시간이 늘어난 것인지에 대해서 표본 또는 실험의 결과를 가지고 판단을 내리는 통계적 추론절차를 가설검정(hypothesis testing)이라 한다.

통계적 가설검정은 재판과정과 마찬가지로 간접적인 방법 즉, 주장과 반대되는 가설을 사실로 가정한 상태에서 검정이 이루어진다.

즉, 두 개의 가설(H1과 H0)을 세운 후에 검정이 이루어지는데, 이때 두 개의 가설은 법정에서와 같이 서로 상반된 것이어야 한다.

새로운 공법의 도입은 충전시간을 늘릴 것이라는 믿음에서 시작했을 것이므로 주장하려는 가설은 “새로운 공법으로 충전시간은 늘어났다.”이며, 이때 주장하려는 가설을 대립가설(alternative null hypothesis)이라 하고 기호로는 H1(또는 Ha)로 표시한다.

이와 반대되는 가설 즉, 주장과 반대되는 가설은 “새로운 공법으로 충전시간은 늘어나지 않았다.”이며, 이때 주장하려는 가설과 반대되는 가설을 귀무가설(또는 영가설, null hypothesis)이라 하고 기호로는 H0로 표시한다.

가설검정은 가설 H0가 사실이라는 가정 하에 검정이 이루어지므로 검정의 초점은 H0에 있다.

가설검정에서 검사의 역할인 조사자(또는 분석자)는 가설 H0 즉, “충전시간은 늘어나지 않았다.”가 사실이 아님을 밝히는 자료를 표본의 결과로부터 제시하는 것이고, 변호사의 역할을 하는 것은 가설 H0가 사실일 때의 분포가 된다.

이 상황에서 판사의 역할은 표본의 결과(검사의주장)가 타당한지를 밝히는 것이다.

가설검정의 결론으로 “가설 H0을 기각하지 않는다(not reject).”라는 의미는 “가설 H0가 사실이다”를 증명한 것이 아니라, 가설 H0가 사실이아니라고 보기에는 표본의 결과(증거)가 충분한 타당성을 갖지 못한다는 것으로서 “가설 H0(귀무가설)가 틀렸다고 볼 수 없다.”는 의미이다.

반대로 “H0을 기각한다(reject).”는 것은 “H0가 사실이 아니다.”를 증명한 것이 아니라, 표본의 결과(증거)가 H0가 사실이 아니라고 보기에 충분한 타당성을 제시하고 있다는 것이다.

따라서 가설검정은 법원에서의 재판과 같이 가설의 옳고 그름(참과 거짓)을 판단하는 것이 아니라 표본의 결과가 “귀무가설 H0가 사실이 아니다.”라는 증거를 얼마나 충분히 제시하느냐에 따라 가설검정의 판단이 이루어진다고 볼 수 있다.

profile
노력하는 중

0개의 댓글