[확률/통계] 확통 단어 개념 정리하기: 모집단, 표본

PhilAI·2023년 8월 28일
0
post-thumbnail

확률과 통계(aka. 확통)기초 공부를 시작하기 전에 몇가지 중요 개념을 반드시 이해하고 넘어간다면 조금 수월합니다. 무턱대고 외웠더니 나중에 개념들이 꼬여 다시 기초부터 배워야 하는 순간이 찾아옵니다.... 🥲(그게 바로 나..;;)

그래서 확률/통계 시리즈를 찬찬히 다시 수정하려고 합니다. 이번은 첫 챕터로 "모집단"과 "표본"에 대한 글을 써볼려고 합니다.

📌모집단(population)이란?

모집단이라는 말은 데이터, 통계등을 공부하셨다면 많이 듣는 단어 중 하나가 아닐까 생각합니다. 하지만 "모집단의 정의가 뭐해요?"라고 묻는다면 당황하는 사람이 꽤 있을 겁니다. (이것도 나... ;;)

쉽게 말해 모집단은 "(알고싶어하는) 전체 집단"이라고 생각하시면 좋습니다.예를 들어 학교 내에 있는 모든 학생들의 키를 조사하려고 한다고 상상해봅시다. 이때, 학교 내의 모든 학생들의 키를 포함하는 집합을 "모집단"으로 정의할 수 있습니다.

(Quiz) 조금 더 어려운 예시를 들어보겠습니다.🧐

한 연구팀은 코로나 백신 A와 백신 B를 개발했다. 두 백신의 효과를 비교하고 싶다. 이 경우 모집단은 무엇이 될까요?

.
.
.
.
.

정답은 백신 두개를 처방했을 때 모든 효과가 모집단이라고 할 수 있습니다. 조금 추상적인 답이죠??
처음에 모집단을 "알고 싶은" 전체 집단이라고 말했습니다. 여기서 "알고 싶은" 매우 특정적일수 있지만 넓고 광범위 할 수도 있습니다. "효과"처럼 말이죠!! 즉, "모집단"은 때때로 추상적일 수 있다는 말입니다.

다시 정리하면 모집단은 "특정 사람이 알고 싶은 전체집단"이지만 경우에 따라 모집단 자체가 매우 추상적일 수 있다는 것입니다.

📌 표본(sample)이란?

표본도 많이 사용하는 단어입니다. 때때로 특정 단어의 개념을 이해할 때 영단어가 편할 때가 있습니다. 표본은 영어로 샘플(sample)입니다. 화장품 가게에서 뭘 사면 샘플 여러개 받는 경우가 있습니다. 샘플은 대게 본제품의 소량을 주어 고객이 본제품을 테스트 해보도록 하는 목적에서 만들어졌습니다.

통계에서도 샘플은 같은 역할은 합니다! 앞서 애기했던 예시처럼 국가 기간에서 우리나라의 남여성의 키의 평균을 알고 싶어 합니다. 이때 전국의 모든 국민을 "모집단"이라고 간주할 수 있겠지요?
그러나 현실적으로 모든 직원의 월급을 직접 조사하는 것은 시간과 노력이 많이 들어갈 수 있습니다. 그래서 모집단(=전국민)에서 남여 각각 1000명씩을 추출해 이를 표본으로 간주하게 됩니다.

이렇게 만들어진 표본을 가지고 저희는 전국민의 키의 평균, 성별 키의 평균 등등을 추정할 수 있게 되는 겁니다 😀!

profile
철학과가 도전하는 Big Data, AI

0개의 댓글