개별적이고 분리된 값들을 가진다. 예: 동전 던지기의 결과(앞면/뒷면), 주사위 던지기의 결과(1~6의 정수)표현: 확률은 특정 값에 대해 직접적으로 정의된다. (주사위: 1/6)확률질량함수를 사용하여 각 값에 대한 확률을 나타낸다.연속적인 값으로, 구간내 모든 값들을
가설검정은 특정가설이 사실인지 아닌지를 결정하기 위해 표본 데이터를 사용한다. 일반적으로 다음과 같은 단계로 이루어진다.귀무가설은 기본적인 가정으로, 검증하고자 하는 주장과 반대되는 주장이다. 일반적으로 "변화가 없음", "효과가 없음", "두 집단간 차이가 없음"과
모집단의 매개변수(모수)에 대한 가설을 검증하는 방법이다.모집단 분포의 가정: 모집단의 분포가 특정한 형태(예: 정규분포)에 따른다고 가정하며, 이러한 가정을 바탕으로 통계적 추론을 진행한다.모수 추정: 평균, 분산, 비율과 같은 모집단의 특정 매개변수를 추정하거나 검
모집단에 대한 분포의 형태를 가정하지 않고 사용되는 통계적 검정 방법이다.분포 가정 불필요: 분포 형태에 대한 정보가 없거나 데이터가 특정 분포를 따르지 않는 경우에 유용하다.범주형 데이터에 적합: 순위나 범주형 데이터에 주로 사용된다.작은 표본 크기에 적합: 표본 크
회귀분석(Regression Analysis)은 통계학에서 변수들 간의 관계를 분석하는 방법이다.주로 하나의 종속 변수(dependent variable)와 하나 또는 그 이상의 독립 변수(independent variables) 간의 관계를 모델링한다.기본적인 목표는
데이터 수집 및 분석 연구: 데이터를 체계적으로 수집, 정리, 분석, 해석하는 과학적 방법론데이터 사실 요약: 평균, 개수 등을 사용해 데이터를 요약하고 사실을 나타내는 정보의사결정: 제품 구매 확률, 결제 시스템의 영향, 호텔 점유율 최적화 등에 활용할 수 있다.예측
확산 (Spread) 개념 확산은 데이터 포인트들이 얼마나 서로 떨어져 있는지를 나타낸다. 데이터가 얼마나 흩어져 있는지를 측정하여 데이터 세트의 변동성을 파악할 수 있다. 분산 (Variance) 분산은 각 데이터 포인트가 평균으로부터 얼마나 떨어져 있는지의