벌써 한 주의 Sprint를 끝내고, 두번째 주가 시작되었다.
sprint1 에서 머신러닝에서 자주 사용하는 파이썬 Pandas libaray 를 배웠고,
이번 sprint2에서는 통계를 배운다.
시간이 남으면 전에 사놨던 '숫자에 약한 사람들을 위한 통계학수업'책을 읽고싶다😂😂😂😂
시간이 남으면... .... 남을까?... 읽고싶은 책이 넘나도 많다.
시간이 남으면 부족한 공부를 복습해야한다는 강박에 책을 읽을 수가 없다 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
기술통계치와 추리통계치
sampling 하는 4가지 방법
1)난수뽑기 2)의도(규칙)를 가지고 샘플링 3)그룹 안에서 일정한 수 뽑기 4)그룹 1개 뽑기
random.randint 와 random.seeds
표준편차/ 표본의 표준편차 /표본 평균의 표준오차
가설검정 (t-statistics, f-statistics 등)
T-TEST(Student t-test)
1 sample t-test
2 sample t-test
귀무가설과 대안가설
/ /0.5 >/ 0.5 </ 0.5 $/
1 tail test, 1 direction test, 1 side test
1 tail test : 같다, 같지않다
2 tail test : 크다 작다
p-value 값
pvalue 값이 0.05보다 작으면 귀무가설을 채택할 수 없다 = 기각한다 =대안가설을 채택
ind =independence 독립가설