
하나의 컬럼으로서 정해지지 않은 임의의 값을 표현하기 위해 사용되는 기호해당 변수에서 대하여 관측된 값들이 바로 자료(Data)가 됨관측된 데이터가 성별,주소지 업종 등과 같이 몇 개의 범주로 구분하여 표현할 수 있는 데이터를 의미데이터 입력 시 1은 남자, 2는 여자

베르누이 분포이항분포포아송분포기하분포음이항분포확률 변수 X가 유한하고, 모든 확률 변수에 대하여 균일할 확률을 갖는 분포주사위를 던졌을 때 균등분포의 기대값과 분산베르누이 시행 : 각 시행의 결과가 성공, 실패 두 가지만 결과만 존재하는 시행을 베르누이 시행이라고 함베

확률밀도함수 : 연속형 확률 변수 X에 대해서 함수 f(x)가 아래 조건을 만족하면 확률 밀도 함수라고 함확률 밀도 함수의 성질확률 밀도 함수의 평균과 분산확률밀도함수를 적분하면 누적분포함수가 됨누적분포함수의 성질0 < F(x) < 1b> a => F(b)

두 변수간의 함수 관계가 선형적인 관계가 있는지 파악할 수 있는 측도가 상관계수임상관계수 -1 <(=) p <(=) 1상관계수가 1에 가까울 수록 양의 상관관계가 강함상관계수가 -1에 가까울 수록 음의 상관관계가 강함상관계수가 0에 가까울 수록 두 변수 간의

통계분석의 관계도

회귀분석변수들간의 함수적 관계를 선형으로 추론하는 통게적 분석 방법으로 독립변수를 통해 종속변수를 예측하는 방법비선형적인 함수적 관계일 경우 비선형회귀를 사용예시 : 마케팅 비용에 따른 매출액을 예측종속 변수다른 변수의 영향을 받는 변수로 반응변수라 표현하기도 하며,

분산분석(ANOVA) : 셋 이상의 모집단의 평균 차이를 검정실험계획법 : 모집단의 특성에 대하여 추론하기 위해 특별한 목적성을 가지고 데이터를 수집하기 위한 실험설계를 실험계획법이라고 함반응변수 : 관심의 대상이 되는 변수요인/인자 : 실험 환경 또는 조건을 구분하는
시계열 분석 : 시간의 흐름에 따라 기록된 자료를 분석하고 여러 변수들간의 인과관계를 분석하는 방법연속 시계열 : 자료가 연속적으로 생성, 대부분의 데이터 형태가 연속형이나 이산형 정의하여 분석이산형 시계열 : 일정 시차를 두고 관측되는 형태의 데이터시계열 분석의 목적