# Statistics

156개의 포스트
post-thumbnail

회귀분석

둘 이상의 변수 간의 관계를 보여주는 통계적 방법 독립변수(X) : 다른 변수에 영향을 주는 변수 종속변수($Y^-$) : 다른 변수의 영향을 받는 변수 산점도 두 변수 사이의 연관성을 살펴볼 수 있는 그림 단순선형회귀분석 하나의 독립변수와 하나의 종속변수 사

약 6시간 전
·
0개의 댓글
·
post-thumbnail

zb 데이터 스쿨 5주차

: 데이터를 탐색하는 분석 방법으로 도표, 그래프, 요약 통계 등을 사용하여 데이터를 체계적으로 분석하는 하나의 방법목적1\. 데이터 분석 프로젝트 초기에 가설을 수립하기 위해 사용2\. 데이터 분석 프로젝트 초기에, 적절한 모델 및 기법의 선정3\. 변수 간 트렌드,

약 8시간 전
·
0개의 댓글
·
post-thumbnail

두 모집단의 비교

독립표본 : 실험 대상을 임의로 두 개의 그룹으로 나누고 각각의 그룹에 A,B 다른 방법을 적용하여 그 실험 결과를 비교 ex) 남자와 여자의 1년 다이어트 후 평균 몸무게 차이대응표본(짝비교) : 비슷한 조건을 가진 실험군을 하나의 쌍으로 묶고 하나에는 A, 나머지

2일 전
·
0개의 댓글
·
post-thumbnail

정규모집단에서의 추론(표본의 크기가 작을 때)

독립된 두 집단의 평균의 유의미한 차이가 있는지를 검사한다일반적으로 $n\\leq30$ 즉 적은 수의 표본에 대해 사용한다. / 표본이 많으면 정규분포를 사용하면된다.모집단의 표준편차($\\sigma$)를 모를 때 사용한다.자유도가 증가할수록 표준정규분포에 가까워진다(

3일 전
·
0개의 댓글
·
post-thumbnail

통계적 추론(표본의 크기가 클 때)

표본의 정보를 통해 모집단의 특성을 추론추정량 : 추정치를 구하기 위해 사용되는 추정 방법이나 도구 ex) 모평균의 추정량은 표본평균이고 모분산의 추정량은 표본분산이다추정치 : 추정량의 구체적인 수치값모수를 하나의 값으로 추정단점 : 점을 하나만 가지고 추정하기에 추정

2022년 9월 26일
·
0개의 댓글
·
post-thumbnail

표집분포

모수 : 모집단의 특성을 나타내는 값으로 모평균, 모분산 등이 이에 해당한다. 추론 : 실제로는 모수는 모집단을 전수조사해야만 알 수 있지만 불가능 하기에 표본조사를 통한 표본평균, 표본분산의 값 등으로 모평균, 모분산등을 추정할 수 있다.통계량 : 관측한 자료에 의해

2022년 9월 25일
·
0개의 댓글
·
post-thumbnail

정규분포

주어진 구간에서 확률이 어떻게 분포하는지에 대한 함수를 계산특정 x값이 가질수 있는 확률은 0임확률밀도함수 구하는 방법은 x축과 그래프 사이의 넓이를 구하면되고 전체 넓이는 1이다.$X$~$N(\\mu,\\sigma^2)$$f(x) = \\frac{1}{\\sqrt{2

2022년 9월 24일
·
0개의 댓글
·
post-thumbnail

이항분포와 그에 관련된 분포들

베르누이 시행 각 시행의 결과가 성공, 실패로 두가지 중 하나만 나오는 경우 조건 각 시행의 결과는 성공(S) 혹은 실패(F) 중 하나로 분류 각 시행에서 성공확률 p 실패확률 1-p로 그 값은 일정함 각 시행은 서로 독립 이항분포 $n$

2022년 9월 23일
·
0개의 댓글
·
post-thumbnail

확률분포

표본공간의 각 결과에 실수 값을 대응시키는 함수흔히 X,Y,Z를 사용하여 나타냄확률 변수는 크게 이산확률변수와 연속확률변수로 나뉜다.이산확률변수 : 확률변수가 가질 수 있는 값을 셀 수 있는경우연속확률변수 : 확률변수가 어느 구간에 속하는 모든 값을 가질 수 있는 경우

2022년 9월 21일
·
0개의 댓글
·
post-thumbnail

확률

확률 어떤 사건이 일어날 가능성을 0과 1사이의 값으로 나타낸 것 표본공간 : 일어날 수 있는 모든 결과들의 집합 근원사건 : 일어날 수 있는 각각의 결과 사건 : 어떤 특성을 갖는 결과들의 집합 (표본공간의 부분집합) P(A) : 사건 A가 발생활 확률

2022년 9월 19일
·
0개의 댓글
·
post-thumbnail

두 변수 자료의 요약

조사 대상으로부터 두 개 이상의 변수들을 동시에 관측하는 경우주로 두 변수 사이의 연관성에 초점을 둔다ex) 아버지와 아들의 키, 학생의 국어, 영어, 수학 성적 등두 변수가 모두 범주형인 경우에 표를 이용하여 요약한다2차원 도수분포표가로 : 한 변수에 대한 범주세로

2022년 9월 18일
·
0개의 댓글
·
post-thumbnail

수치를 통한 연속형 자료의 요약

표와 그림을 이용한 자료 요약의 단점 일관성 객관성 부족 / 작성자의 주관적 판단에 따라 달라질 수 있음 추론을 위한 이론적 근거 부족 이를 보완하기 위해 객관적인 수치로 자료의 분포를 파악 중심위치의 측도 평균 모든 관측값의 합을 자료의 개수로 나눈 것 일반적

2022년 9월 18일
·
0개의 댓글
·
post-thumbnail

표,그림을 이용한 자료 요약

자료의 형태 수치 자료 (양적 자료) : 관측되는 값이 수치로 측정되는 자료 연속형 자료 : 연속적인 값을 가지는 자료 / ex) 키, 몸무게 이산형 자료 : 이산적인 값을 가지는 자료 / ex) 주사위, 사람 수 > 연속형자료 VS 이산형자료

2022년 9월 18일
·
0개의 댓글
·
post-thumbnail

통계학이란

통계학 데이터를 정리, 분석, 해석 하여 그 결과를 제시하는 학문 , 주어진 자료를 토대로 보편 타당한 이론을 추론해 내는 학문 자료 분석 단계 자료를 효과적으로 수집 자료를 합리적으로 해석 자료로부터 올바른 결론을 유도 모집단과 표본 모집단 : 수집가능한

2022년 9월 18일
·
0개의 댓글
·
post-thumbnail

Markov Chain Monte Carlo

MCMC라고도 하는 Markov Chain Monte Carlo 기법은 확률분포에서 샘플을 추출하는 여러 종류의 알고리즘을 일컫는다. 다양한 머신러닝 이론들이 등장하며, 기존 통계학에서 다룰 수 없을 정도의 수만-수백만 개의 변수 및 파라미터를 사용하는 모델들 역시 등

2022년 9월 11일
·
0개의 댓글
·
post-thumbnail

Mixture Model & EM-Algorithm

Mixture Model은 Latent Variable Model(LVM)의 일종이다. 여기서 LVM은 관측된 변수들간의 상관관계를 숨겨진 공통원인(common cause)에서 비롯된 것으로 가정한 모델이다. LVM을 이용하면, 차원축소(ex. PCA)를 수행하는 것과

2022년 9월 8일
·
0개의 댓글
·

Gaussian Process (1)

Gaussian Process(줄여서 GP라고도 한다)는 비모수방법의 일종으로, 사전분포를 표현하여 베이즈 정리를 바탕으로 사후확률을 추론하는 기법으로 사용된다. 길이 $N$의 가우시안 랜덤 벡터(Gaussian Random Vector)란$$\\mathbf{f} =

2022년 9월 6일
·
0개의 댓글
·

확률/통계기반 머신러닝 책 추천

구글에 검색해보면 통계기반 머신러닝 책을 아래와 같은 5가지의 책을 추천한다. 그런데 실제로 보면, ESL과 ISLR, 그리고 \#5 An Introduction to Statistical Learning with Applications in R ("ISLR")

2022년 8월 17일
·
0개의 댓글
·
post-thumbnail

ISLR 읽고 이해하기 Chap.3

단순선형회귀, 계수추정

2022년 8월 11일
·
0개의 댓글
·
post-thumbnail

Statistics to Detect Fraud

오늘도 속아 넘어가는 당신에게.

2022년 8월 9일
·
0개의 댓글
·