이산/연속 확률 변수 종류와 정의 특징을 알아보자
베르누이 시행을 n번 반복했을 때 k번 성공할 확률
성공할 확률 p 0이나 1에 가깝지 않고 n이 충분히 크면 이항분포는 정규분포에 가까워 진다
시간과 공간 내에서 발생하는 사건의 발생횟수에 대한 확률분포
응용
- 책에 오타가 5page당 10개씩 나온다고 할 때, 한 페이지에 오타가 3개 나올 확률
- 어떤 시간 동안 톨게이트를 통과하는 차량의 수
정해진 시간 안에 어떤 사건이 일어날 횟수에 대한 기댓값을 라고 했을 때, 그 사건이 회 일어날 확률은 다음과 같다.
가능한 값이 실수의 어느 특정구간 전체에 해당하는 확률 변수
확률 밀도 함수를 이용하여 분포를 표현할 수 있는 확률분포
확률 밀도 함수 는 다음 두 조건을 만족하여야 한다.
평균이 이고, 표준편차가 인 의 확률 밀도 함수
표준편차가 클 경우 퍼져보이는 그래프가 나타난다.
정규분포는 2개의 매개 변수 평균 과 표준편차 에 대해 모양이 결정되고, 이때의 분포를 로 표기한다. 특히, 평균이 0이고 표준편차가 1인 정규분포 을 표준 정규 분포(standard normal distribution)라고 한다.
정규 분포 밀도 함수에서 를 통해 X(원점수)를 Z(Z점수)로 정규화함으로써 평균이 0, 표준편차가 1인 표준정규분포를 얻을 수 있다.
붉은 색: 표준정규분포 좌우가 대칭
왜도
- : 오른쪽으로 긴 꼬리를 갖는 분포 (위 녹색 분포)
- : 좌우 대칭인 분포
- : 왼쪽으로 긴 꼬리를 갖는 분포
첨도
- $m > 0 $ : 표준 정규 분포 보다 더 뾰족함 위 파란 분포
- $m = 0 $ : 표준 정규 분포와 유사함
- $m < 0 $ : 표준 정규 분포보다 덜 뾰족함 (위 노란색 분포)
어떤 사건이 발생할 때까지 경과 시간에 대한 연속 확률 분포
ex) 콜센터에 전화가 걸려올 때까지의 시간, 전자레인지의 수명시간
와 관련
표준정규분포와 같이 평균이 0을 중심으로 좌우가 동일한 분포를 따름
하지만 정규분포보다 더 퍼져있고 자유도가 커질수록 정규분포에 가까워 진다.
모평균과 모분산이 알려지지 않은 모집단의 모분산에 대한 가설 검정에 사용되는 분포
사진 출처: 위키백과