통계학 데이터를 정리, 분석, 해석 하여 그 결과를 제시하는 학문 , 주어진 자료를 토대로 보편 타당한 이론을 추론해 내는 학문 자료 분석 단계 자료를 효과적으로 수집 자료를 합리적으로 해석 자료로부터 올바른 결론을 유도 모집단과 표본 모집단 : 수집가능한
자료의 형태 수치 자료 (양적 자료) : 관측되는 값이 수치로 측정되는 자료 연속형 자료 : 연속적인 값을 가지는 자료 / ex) 키, 몸무게 이산형 자료 : 이산적인 값을 가지는 자료 / ex) 주사위, 사람 수 > 연속형자료 VS 이산형자료
표와 그림을 이용한 자료 요약의 단점 일관성 객관성 부족 / 작성자의 주관적 판단에 따라 달라질 수 있음 추론을 위한 이론적 근거 부족 이를 보완하기 위해 객관적인 수치로 자료의 분포를 파악 중심위치의 측도 평균 모든 관측값의 합을 자료의 개수로 나눈 것 일반적
조사 대상으로부터 두 개 이상의 변수들을 동시에 관측하는 경우주로 두 변수 사이의 연관성에 초점을 둔다ex) 아버지와 아들의 키, 학생의 국어, 영어, 수학 성적 등두 변수가 모두 범주형인 경우에 표를 이용하여 요약한다2차원 도수분포표가로 : 한 변수에 대한 범주세로
확률 어떤 사건이 일어날 가능성을 0과 1사이의 값으로 나타낸 것 표본공간 : 일어날 수 있는 모든 결과들의 집합 근원사건 : 일어날 수 있는 각각의 결과 사건 : 어떤 특성을 갖는 결과들의 집합 (표본공간의 부분집합) P(A) : 사건 A가 발생활 확률
표본공간의 각 결과에 실수 값을 대응시키는 함수흔히 X,Y,Z를 사용하여 나타냄확률 변수는 크게 이산확률변수와 연속확률변수로 나뉜다.이산확률변수 : 확률변수가 가질 수 있는 값을 셀 수 있는경우연속확률변수 : 확률변수가 어느 구간에 속하는 모든 값을 가질 수 있는 경우
베르누이 시행 각 시행의 결과가 성공, 실패로 두가지 중 하나만 나오는 경우 조건 각 시행의 결과는 성공(S) 혹은 실패(F) 중 하나로 분류 각 시행에서 성공확률 p 실패확률 1-p로 그 값은 일정함 각 시행은 서로 독립 이항분포 $n$
주어진 구간에서 확률이 어떻게 분포하는지에 대한 함수를 계산특정 x값이 가질수 있는 확률은 0임확률밀도함수 구하는 방법은 x축과 그래프 사이의 넓이를 구하면되고 전체 넓이는 1이다.$X$~$N(\\mu,\\sigma^2)$$f(x) = \\frac{1}{\\sqrt{2
모수 : 모집단의 특성을 나타내는 값으로 모평균, 모분산 등이 이에 해당한다. 추론 : 실제로는 모수는 모집단을 전수조사해야만 알 수 있지만 불가능 하기에 표본조사를 통한 표본평균, 표본분산의 값 등으로 모평균, 모분산등을 추정할 수 있다.통계량 : 관측한 자료에 의해
표본의 정보를 통해 모집단의 특성을 추론추정량 : 추정치를 구하기 위해 사용되는 추정 방법이나 도구 ex) 모평균의 추정량은 표본평균이고 모분산의 추정량은 표본분산이다추정치 : 추정량의 구체적인 수치값모수를 하나의 값으로 추정단점 : 점을 하나만 가지고 추정하기에 추정
독립된 두 집단의 평균의 유의미한 차이가 있는지를 검사한다일반적으로 $n\\leq30$ 즉 적은 수의 표본에 대해 사용한다. / 표본이 많으면 정규분포를 사용하면된다.모집단의 표준편차($\\sigma$)를 모를 때 사용한다.자유도가 증가할수록 표준정규분포에 가까워진다(
독립표본 : 실험 대상을 임의로 두 개의 그룹으로 나누고 각각의 그룹에 A,B 다른 방법을 적용하여 그 실험 결과를 비교 ex) 남자와 여자의 1년 다이어트 후 평균 몸무게 차이대응표본(짝비교) : 비슷한 조건을 가진 실험군을 하나의 쌍으로 묶고 하나에는 A, 나머지
둘 이상의 변수 간의 관계를 보여주는 통계적 방법 독립변수(X) : 다른 변수에 영향을 주는 변수 종속변수($Y^-$) : 다른 변수의 영향을 받는 변수 산점도 두 변수 사이의 연관성을 살펴볼 수 있는 그림 단순선형회귀분석 하나의 독립변수와 하나의 종속변수 사
여러 개의 다른 모집단의 평균, 분산값을 비교하는 분석기법ANOVA의 결과값은 F 통계량이다.t-검정의 경우 1-2개의 표본만 비교할 수 있었지만 F-검정의 경우 여러개를 비교할 수 있다.독립변수 : 이산형, 범주형 변수만 가능종속변수 : 연속형 변수만 가능$Y{ij}
적합성 검정 : 하나의 변수에 대해 우리가 기대하는 분포를 따르는지 여부를 검정한다. 즉 기대하는 값과 실제값이 같은지 예측하는 것이다.동질성 검정 : 두 범주형 변수 사이에서 같은 확률분포를 가지는지 즉 그룹들이 동질한지에 대해 검정하는 것이다.독립성 검정 : 두 범