zb 데이터 스쿨 5주차

suji·2022년 10월 4일
0

통계

목록 보기
1/1

기초통계1

📝EDA (Exploratory Data Analysis)

: 데이터를 탐색하는 분석 방법으로 도표, 그래프, 요약 통계 등을 사용하여 데이터를 체계적으로 분석하는 하나의 방법

목적
1. 데이터 분석 프로젝트 초기에 가설을 수립하기 위해 사용
2. 데이터 분석 프로젝트 초기에, 적절한 모델 및 기법의 선정
3. 변수 간 트렌드, 패턴, 관계 등을 찾고 통계적 추론을 기반으로 가정을 평가
4. 분석 데이터에 적절한가 평가, 추가 수집, 이상치 발견 등에 활용


📝데이터 시각화


📝확률 분포

📝이산형 확률분포



📝표준 정규 분포

📝연속형 확률분포



📝표본추출(Sampling)_ Over, Under sampling


📝표본분포


📝중심극한 정리(central limit theorem)



📝T분포


📝F분포


📝모평균의 구간 추정

✔모집단의 분산을 아는 경우 -> Z~N(0,1)
✔모집단의 분산을 모르는 경우 -> T~t(n-1)


📝모평균 차이의 추정(소표본, 모분산을 모르는 경우)


📝가설 검정 절차

  1. 가설 수립

    H0: 코로나 백신이 효과가 없다. vs H1: 코로나 백신이 효과가 있다.

  2. 유의 수준 결정: 유의 수준 α정의

  3. 기각역 설정

  4. 검정통계량 계산

  5. 의사 결정


📝모평균 가설검정

✔모집단의 분산을 아는 경우 -> Z~N(0,1)
✔모집단의 분산을 모르는 경우 -> T~t(n-1)


📝두개의 표본에 대한 가설검정

✔모집단의 분산을 아는 경우 -> Z~N(0,1)
✔모집단의 분산을 모르는 경우 -> T~t(n-1), Sp^2

🔎엑셀 풀이


📝적합도 검정


📝분산분석표(ANOVA)

profile
learning Data Science

0개의 댓글