[데이터사이언스] Diary-(8)

Pream·2022년 1월 27일
0

1월27일(목)

-ANOVA ( f-oneway ):

    1. 3개 이상 그룹의 “평균”에 차이가 있는지를 가설 검정하는 방법.
    1. 여러그룹간의 차이가 있는지를 확인하려면 어떻게 해야할까?
      일단, “여러그룹들이 하나의 분포에서부터 왔다” 라고 가정.
      차이를 확인할수 있는 지표는 F-statistic 임.

      	F = Variance-between-group / Variance-with-in-group
      
      	F가 클수록 그룹끼리의 분포가 다를것이다. 즉, 차이가 유의미 하다.
      
      	

-CLT (중심극한정리) : sample 데이터의 수가 많아질수록 sample의 평균은 정규분포에 근사. 즉, 어떤 미지의 분포표든 상관없이 그곳에서 표본을 추출한 평균은 정규분포를 따른다.

-큰 수의 법칙 : sample수가 커질수록 sample의 통계치(평균,분산 등)은 점점 모집단의 모수와 같아진다.

-신뢰도 : 신뢰도가 95%라는 의미는 sample을 100번 뽑았을때 95번은 신뢰구간 내에 모집단의 “평균”이 존재한다.

  • plt.bar(x = 's1',height=mean1 , xerr=0.2 , yerr=CI1[0]-mean1, capsize=7)
    Yerr = 여기에 왜 CI1 - mean1 이 들어 가는거냐? ㅠㅜㅠㅠㅠㅠㅠ
profile
예비 데이터개발자

0개의 댓글