Chapter3 D-1 TIL

홍유택·2025년 1월 16일

-통계학 정리
정규분포 -> 데이터가 충분히 많은 상황

student-t 분포 -> 데이터 수가 작은 상황

long tail 분포 -> 특정 데이터가 많은 영향을 미치는 상황
ex) 서점 베스트셀러의 판매량이 대부분의 판매량을 차지함.

카이제곱 분포 -> 범주형 데이터의 독립성 검정이나 접합도 검정
ex) 나이와 지역에 따른 지지율

이항 분포 -> 성공 또는 실패 처럼 결과가 두개만 나오는 상황
ex) 제조 공장에서 불량률을 모니터링 할때(불량, 합격)

-라이브 세션
데이터 분석 5단계
문제 정의 -> 가설 설정 -> 데이터 수집 -> 가설 증명 -> 결론

데이터 수집 => SQL, 크롤링, 기타 등등
가설 증명 => 시각화, 통계적방법, 머신러닝/딥러닝

가설을 정하고 가설마다 한명씩 or 두명씩 검증 진행 -> 막히면 회의
위 과정을 반복하면서 가설 증명, 결론

(너무 붙어있으면 입김이 강한사람의 의견으로 수렴당함)

profile
안녕하세요

0개의 댓글