본 글을 이화여자대학교 송종우 교수님의 러닝패킷: 통계의 기초 강의를 정리한 것입니다.
러닝패킷: 통계의 기초
이 현상이 개별적인 결과를 예측할 수는 없으나 여러 번 반복했을 때 그 결과가 규칙적인 분포를 따르게 되는 것을 의미한다.
매우 여러번 반복했을 때 결과가 나오는 비율.
즉, 상대빈도로 정의된다.
랜덤한 현상 또는 실험의 결과로 결정되는 수치적인 양
매번 시행 때마다 다른 값을 가질 수 있으며 일정한 확률분포를 가진다.
동전 던지기는 1) 랜덤하다
, 2) 확률변수
에 대해 설명하기 좋은 예이다.
이산 확률 변수 x는 유한, 또는 셀 수 있는 무한의 값만을 가질 수 있는데, 그 확률 분포는 모든 가능한 값에 대해 그 값이 나올 확률을 대응시키는 확률분포표나 히스토그램등으로 표현될 수 있다.
연속 확률 변수 x는 어떤 구간안의 모든 값을 다 취할 수 있는 변수이다. 이 때 확률분포는 이산확률변수와 달리 확률밀도함수로 표현된다.
연속형의 경우 확률은 각 구간에 할당되며 그 확률은 확률밀도 함수를 그 구간에서 적분한 값, 즉 밀도함수 아래의 면적과 같다.
확률밀도함수는 양의 값을 가지며 전체 구간에서 적분한 값은 1 이어야한다.
연속확률변수가 단 하나의 값을 가질 확률은 0이다.