5/12 통계 학습

boks·2024년 5월 12일

수학

목록 보기
3/7
post-thumbnail

📖 학습한 내용

  • 비모수검정의 대푯값 비교

📖 핵심내용

📌 비모수검정의 대푯값 비교

  • 비모수검정 : 모집단의 분포에 대한 가정이 없이 검정하는 것 (정규성이 없다 / 모평균, 모분산 따위)
  • 정규성 : 정규분포를 따르는 성질

종류

  • 윌콕슨 순위합 검정 : 각 데이터 값의 순위에 기반하여 검정 (크기순으로 나열했을 때 몇번째 위치인지 나타내는값)

    귀무가설 : 두개 모집단의 위치가 같다.
    대립가설 : 두개의 모집단의 위치가 다르다.

  • 맨-휘트니 U검정 : 집단의 모양이 똑같을때 사용 (순산이 같아야한다.)

📌 분산분석

  • 3개 집단 이상의 평균값 비교

    귀무가설 : 모든 집단의 평균이 같다
    대립가설 : 적어도 한쌍에는 차이가 있다.

  • F값 : 평균적인 집단 간 변동 / 평균적인 집단 내 변동
    -> 귀무가설이 올바르다면, F분포를 따른다.
    -> F분포를 따르지 않는다면 대립가설 채택
    -> 적어도 한쌍에는 차이가 있다는 결론을 얻기 위함.

📌 다중비교 검정

  • 이표본 t검정과 비슷하나, 1종오류증가를 고려함

종류

1) 본페로니 교정

  • 각 검정시 유의수준을 (전체 유의수준 / 반복횟수)로 기준으로 하여 검정

2) 던넷 검정

  • 대조군과만 각각의 집단을 비교

3) 윌리엄스 검정

  • 집단 간에 순위를 매길 수 있는 경우 사용

📌 범주형데이터

  • 평균값 등 통계량을 계산할 수 있는 양적 데이터와는 달리, 각범주에 포함된 개수만이 계산 가능한 값

📌 이항검정

  • 하나의 범주가 확률 P, 나머지 하나의 범주가 확률 1-P로 나타나는지 조사하는 것

  • 치우치지 않은 동전인지 확인하는 가설 예시

    귀무가설 : 앞면이 1/2, 뒷면이 1/2 확률로 나온다.(치우치지 않음)
    대립가설 : 앞면이 1/2, 뒷면이 1/2 확률로 나오지 않는다.(치우침이 있음)

  • 얻은 데이터를 기반으로 나올 확률을 이항분포검정과 같은 방법으로한다.

📌 카이제곱검정 : 적합도검정

  • 모집단이 어떤 이산확률분포인지 검정하고 싶을 때 사용
  • (실제 출현도수-기대도수)^2 / 기대도수

    귀무가설 : 모집단은 상정한 이산확률분포다.
    대립가설 : 모집단은 상정한 이산확률분포가 아니다

📌 카이제곱검정 : 독립성검정

  • 한쪽변수의 범주가 바뀌었을때, 다른쪽 변수의 범주 비율이 달라지는지 확인
  • (실제 출현도수-기대도수)^2 / 기대도수

    귀무가설 : 2개의 변수는 독립이다.
    대립가설 : 2개의 변수는 독립이 아니다.

📖 흥미로운 점 / 새로 알게된 점

  • 읽는 내내 검정을 왜하는지 잘 이해안되었다. 하지만 어느순간 읽다보니, 이게 무언가를 알아내고 싶고, 그러기 위해 가정을 세우고, 가정 중 귀무가설을 기각하므로써, 원하는 결과를 얻는 과정인것을 알았다. 당장 눈앞의 설명을 이해하느라 전체적으로 뭐하는지 몰랐던 것 같았다.

📖 어려운 부분

  • 카이제곱 분포를 이용해 검정을 한다고만 했지, 따로 알려주는 것이 없었다. 그래서 직관적인 이해가 되지 않았다. 또한 자유도에 대한 설명이 부족하여 책을 읽는 동안 이해하기가 어려웠다.
    깃허브에 여러 자료가 나와있어서 이것 저것 읽다가 좋은 사이트를 알았다. 자유도란 모집단에서 수집한 표준과 같은 뜻이였고, 당연히 자유도가 높아질수록 정규분포와 비슷해지는 것을 알았다.

참고 : 깃허브 공돌이의 수학, https://angeloyeo.github.io/2021/12/13/chi_square.html

📖 이후 학습 계획

  • 상관과 회귀에 대해서 공부할 계획이다.
  • 휴일에 짬을 내서 계속 읽을 계획이라 5/15일날 다시 시작할 생각이다.

📖 기타

  • 아직 모르는 부분이 많지만 용어 익숙해지는 과정인 것을 느꼈다. 이후 재독할때는 술술 읽히고 머리속에 들어왔으면 좋겠다.
    그리고 인터넷 강의로 데이터분석과 관련된 수학을 배워볼 생각이다. 지금의 내용은 너무 겉핥기 식으로 넘어가는 것 같아서, 전문적으로 배우고 싶다는 생각이 들었다. 좋은 데이터 관련 직종의 전문가가 되고 싶다.
profile
설계엔지니어의 변신

0개의 댓글