표본을 추출할 때 방법론이 두 가지로 나뉜다.
1. Random
2. Not Random
1.Random
Simple Random Sample : 단순하게 그냥 무작위로 추출하는 것.
컴퓨터로 난수를 발생시켜 뽑는 방법 등이 예시가 된다.
Stratified : 모집단을 계층화시켜 표본을 추출하는 방법이다.
고등학교에서 학생들을 무작위로 추출한다면 특정 학년 등에 우연히 집중되어 추출될 수 있기 때문에
학년으로 계층화시켜 뽑는 방법이 예시가 된다.
clustered : 계층화시켜 뽑더라도 만약 성별이 중요한 문제가 될 수 있는데
특정 학년에서 남학생에게만 집중되어 뽑힐 수가 있다.
각 교실이 남녀의 성비가 비슷하다고 가정하고 몇 개의 교실을 뽑아 추출하는 것이 예시가 된다.
2.Not Random
Voluntary : 자발적 응답이다. 학교에서 방송으로 어떤 웹사이트 주소를 주면서 설문조사 중이니 참여해달라고 했을 때
아이들이 자발적으로 나서서 참여하는 경우이다.
Convenience : 예시로 표본을 추출할 때 그냥 내 앞에 있는 10가지 혹은 선착순 이런 식으로 편의로
추출하는 방법을 말한다.
이 두 방법은 모두 편향을 일으킬 수 있는데 살펴보자.
자발적 응답의 경우 어떤 주제를 갖고 설문조사를 할 때에 특정 주제에 관심이 있는 학생들이 집중적으로 참여를 하거나 싫어하는 학생들이 집중적으로 참여해 표본이 잡힐 수 있기 때문에 편향이 발생할 수 있다.
학생들의 성적에 대해 조사를 할 때에 만약 등교 선착순 100명이라고 한다면, 가장 성실한 학생 100명이 뽑혀 성적이 고르지 않고 상위권의 학생이 뽑힌다거나, 이른 아침 추가적으로 보충강의를 듣는 학생들이 표본으로 몰릴 수 있기 때문에 편향이 발생할 수 있다.
그 밖의 편향유발요인으로는 wording, response bias가 있다.
wording은 설문조사에서 단어를 어떤 것을 쓰냐에 따라 편향이 생길 수 있다. 예를 들면 청소년 흡연율에 대해 조사를 한다고 해보자 근데 설문조사의 내용이 만 19세 미만의 청소년이 흡연을 하는 것은 불법으로 경찰서에 끌려갈 수 있습니다. 본인은 흡연을 하는 중인가요? 이런 멘트가 편향을 일으킬 수 있다.
또한, response bias는 설문 대상자의 응답으로 인해 본인이 피해를 입거나 밝히고 싶지 않은 경우에 편향이 일어날 수 있는 것이다. 뭐 여성 흡연자를 조사하는데, 여성 흡연자의 인식이 남성들에 좋지 않은 경향이 있어 자신의 흡연 여부가 드러날까 걱정이 되어 응답을 피하거나 올바른 응답이 나오지 않을 경우가 될 수 있을 것 같다.