ex) 동전을 던져서 앞면이 나올 확률 -> 1/2

베이즈 정리

b) 문제가 베이즈 정리에 해당함


확률 변수의 평균: 기대값

분산

확률변수 x가 취할 수 있는 모든 값과 그 값을 나타날 확률을 표현한 함수

확률 변수 x가 유한개이고, 모든 확률 변수에 대하여 균일한 확률을 갖는 분포
ex) 주사위 굴려서 숫자가 나올 확률

베르누이 시행: 각 시행의 결과가 성공, 실패 두가지 결과만 존재하는 시행을 베르누이 시행이라고 함.
베르누이 분포의 평균: P, 분산 P(1-P) 그냥 외우기

이항분포: 연속적인 베르누이 시행을 거쳐 나타나는 확률 분포
서로 독립(공을 하나 뽑고 연속해서 더 뽑는게 아니라 공을 다시 넣고 다시 뽑는 것이 독립의 의미)
이항분포의 평균: np
이항분포의 분산: npq -> q = 1-p 이므로 np(1-p)


포아송 분포: 어느 희귀한 사건이 어떤 일정한 시간대에 특정한 사건이 발생할 확률 분포


이항 분포의 포아송 근사

기하분포: 어떤 실험에서 처음 성공이 발생하기까지 시도한 횟수 x의 분포, 이때 각 시도는 베르누이 싱행을 따름

어떤 실험에서 성공확률이 p일 때, r번의 실패가 나올 때 까지 발생한 성공 횟수의 x의 확률분포

베르누이 분포를 n 번 반복하면 이항분포


확률밀도함수를 적분하면 누적분포함수가 됨

F(b) - F(a): 확률 x가 a와 b사이에 있을 확률이다.
확률 변수 x가 a와 b사이에서 아래와 같은 확률 밀도 함수(pdf)를 가짐



분포를 표준화해서 비교한다.
성질이다른 것들을 표준화 해서 비교한 뒤에 다시 원래대로 돌림.
ex) 섭씨와 화씨를 그대로 비교할 순 없으니 표준화 해서 비교 한 뒤에 다시 원래 값으로 돌림.
시그마 = 1, 평균 = 0으로 표준화



B(n,p): 이항분포
N(μ, σ^2): 정규분포
'이항분포는 n 이커질수록 정규분포에 가까워진다' 는 뜻
이항분포의 평균 np -> 정규 분포의 평균 μ
이항 분포의 분산 np(1-p) -> 정규 분포의 분산 σ^2
-> 평균이 np, 분산이 np(1-p)인 정규 분포로 근사할 수 있다.

엑셀에서 정규 분포를 구하는 함수: NORM.DIST
(예시5)엑셀에서 z알파의 값을 찾는 함수: NORM.INV

람다: 단위 시간당 이벤트가 발생하는 수





모집단으로 부터 표본을 추출하는 것을 sampling이라고 한다.
sampling이라는 말을 많이 씀.



과도적합: 샘플링한것들을 다 맞춰가려고 하는 것임.

S^2 은 편차의 제곱의 합을 (n-1)로 나눈 것


iid: 모든 표본은 서로 독립이고 동일한 분포에서 뽑는다
표본이 충분히 크면 정규분포를 따른다


분산분포, 회귀분포에서도 이 개념을 사용함.


자유도
표본 크기가 5, 표본 평균이 3이면 만약 숫자가 1,2,3,4로 정해져있다면 마지막 5번째 숫자는 5여야만 표본 평균이 3이됨.









알파는 오차


모집단의 분산을 모르는 경우 t분포를 사용한다.
밑에 오타: t0.25 -> t0.025


계속 모니터로만 공부하기 어려워 이후 통계 부분은 종이 필기로 대체