✔️ 데이터 분석 시, 해당 데이터로 얻고자 하는 구체적인 목표와 알고자 하는 대상을 명확히 하는 것이 제일 중요하다. 그렇기에 모집단에서 표본으로 수집 단위를 좁혀 특정 집단의 성질을 예측하는 것이다.
통계학에서 알고자 하는 대상 전체를 말한다.
상술한 데이터 분석 목적과 알고자 하는 대상에 기초하여 직접 설정해야 한다.
얻을 가능성이 희박한 데이터는 수집에 적합하지 않으며,
'알고자 하는 대상은 무엇인지' / '무엇을 모집단으로 설정할 것인지'의 문제에는 항상 주의를 기울여야 한다.
유한 모집단: 모집단 중 한정된 요소(특정 범주)만 포함하는 것이다. 원칙적으로 세어 볼 수 있으나 시간과 비용이 많이 들어 현실적이지 않다.
무한 모집단: 모집단 중 포함된 요소가 무한한 것을 말한다. 이는 유한 모집단과 유사하게 해당 전체 요소를 전부 조사 및 파악하는 것은 불가능하다.
모집단 크기 및 성질을 파악하기 위해 행해 볼 수 있는 조사 방법이다.
전수조사
모집단에 포함된 모든 요소를 조사하는 것이다.
모집단에 포함된 요소의 개수가 한정된, 유한 모집단일 때 선택이 가능하다.
해당 모집단을 모두 파악 및 기술하기만 해도 특성 파악이 되는 건 사실이나 비용과 시간 면에서 부담이 막대해 잘 사용하지 않는다.
표본조사
모집단의 일부인 표본을 분석해 모집단 전체의 성질을 추정하는 조사 방법이다.
표본은 모집단의 일부를 말하며,
표본추출은 모집단의 일부를 뽑아 내는 과정을 말한다.
표본크기는 표본 내에 포함된 요소의 개수를 말하는데, 보통 n으로 나타낸다.
이는 성질 추정의 확실성 및 가설검정 결과 에 막대한 영향을 끼치므로 분석의 중요 요소 중 하나라고 할 수 있다.
표본개수는 샘플 수와 같은 표현이며, 표본 종류의 개수를 말한다.
예를 들어,
A 집단의 [표본크기는 30개] / B 집단의 [표본크기는 20개]이며
뽑힌 표본은 총 2개이므로 표본개수 및 샘플 수는 2개라고 할 수 있는 것이다.
크기와 개수는 완전히 다른 표현이니 헷갈리지 않도록 조심하자.
또한 표본은 어디까지나 예측에 불과하며 모집단의 성질을 100% 알아맞힐 수는 없기 때문에, 불확실성을 염두에 두고 파악하여야 한다.