# 통계

19개의 포스트
post-thumbnail

[통계] 기술통계, 추정과 신뢰 구간 필기

sql cheatsheet처럼 만들어보려고 했던 통계 필기들!

2020년 9월 8일
·
0개의 댓글

[TIL] 분산, 표본표준편차

생활 데이터 과제로 MBTI와 소개팅 어플의 상관관계를 알아보는 설문을 진행했다. 우리의 가설은 E(외향)성향의 사람이 I(내향)성향의 사람보다소개팅 어플을 통해 오프라인에서 상대방을 만난 경험이 많을 것이다. 였다. 실제 설문을 통해 받은 데이터를 확인해보면 I 성향

2020년 9월 2일
·
0개의 댓글

행복 몰빵 vs 잔잔바리 행복

아주 극단적인 일이 한 번 발생하더라도 원래의 평균 값으로 돌아온다는 이론이다.극단적으로 키가 큰 196cm 아빠한테 나온 자식의 키가 그 이상으로 나올 확률은 낮으며 평균보다는 크겠지만, 196cm 와 평균 사이의 키로 태어날 확률이 높다! 다른 예로는 로또를 맞은

2020년 8월 29일
·
0개의 댓글

[TIL] 생존 편향, 큰 수의 법칙, 평균으로의 회귀

짐 콜린스의 Good to Great의 생존 편향과 큰 수의 법칙, 평균으로부터의 회귀에서 헷갈리던 부분을 정리했습니다

2020년 8월 28일
·
0개의 댓글
post-thumbnail

[수학/통계] 선형대수 - 고윳값과 고유벡터/SVD/PCA 강의 자료

Showing that an eigenbasis makes for good coordinate systems | Linear Algebra | Khan Academy AMATH 301 - Lecture: The Singular Value Decomposition (SV

2020년 8월 26일
·
0개의 댓글

[금융/통계] 위험 요인(β)과 알파 요인(α)

위험 요인(β)과 알파 요인(α)의 구분 위험 요인(β, Risk Factor) 자산 기대수익률의 분산을 설명한다. 자산의 위험도 측정 (e.g. 시장 수익률 등) 알파 요인(α, Alpha Factor) 자산 기대수익률의 평균을 설명한다. 자산 구매 신호

2020년 8월 14일
·
0개의 댓글

[금융/통계] 요인 모형: Factor Models and Types of Factors

요인 모형 Factor Model 요인 모형의 가정 분석 대상인 다수의 데이터가 소수의 공통 요인(common factor)을 가진다. 즉, 다수 데이터의 가변성을 설명하는 소수의 공통 변수들이 존재한다. > ### 예시: 주식 수익률 > 주식 수익률 시계열은 시장

2020년 8월 14일
·
0개의 댓글
post-thumbnail

[통계] 12-3. Evaluation of Regression Models 회귀 모형의 적합도 판정

회귀 모형의 적합도를 판정한다는 것은, 다시 말해 종속변수가 독립변수들로 설명될 수 있을지를 판정하는 일이다. $$(실제값과\\ 평균의\\ 차이) = (추정치와\\ 평균의\\ 차이) + (잔차)$$위 그래프를 통해 직관적으로 알 수 있는 식이다. 이 식을 일반화하여 표

2020년 7월 31일
·
0개의 댓글
post-thumbnail

[통계] 12-2. Simple Linear Regression 단순선형회귀

각 1개의 독립변수와 종속변수를 가진 데이터셋을 가정할 때, Data points의 중심을 통과하는 하나의 직선을 상상할 수 있다. 최적의 직선을 찾는 과정이 선형회귀이다. 잔차\*들의 거리가 가장 작은 직선. \* (실제값) - (추정치)잔차제곱합($RSS$: Res

2020년 7월 31일
·
0개의 댓글

[통계] 12-1. 회귀분석을 하기 위한 준비

내 데이터의 평균, 분산, 공분산이 시간이 지나도 일정한가? = 내 데이터가 정상 확률 과정(stationary process)을 따르는가?The regression model is linear in the coefficients and the error term Th

2020년 7월 31일
·
0개의 댓글
post-thumbnail

게임 리그 오브 레전드(롤)에서의 가상 Report 상황에 관한 베이즈 정리 문제

라이엇 게임즈에서는 리그 오브 레전드 게임에서의 Report와 연관 된 속성을 3 가지로 분류 했습니다. 그 속성을 각각 게임 내 욕설, 게임 내에서의 실력 미달, 게임 내에서의 패작 행위라고 하겠습니다.

2020년 7월 23일
·
0개의 댓글
post-thumbnail

토너먼트 진출에 대한 확률 문제

나는 현재 포커 토너먼트에 진출 해 있습니다. 다음 단계로 진출 하기 위해 서는 이미 정해진 상대 $p{1}$, $p{2}$, $p\_{3}$와 연속으로 반드시 게임을 해야 합니다. 나는 두 명에게 연속으로 승리하면 다음 토너먼트로 진출 할 수 있습니다.

2020년 7월 20일
·
0개의 댓글
post-thumbnail

레이더 알람에 대한 조건부 확률 문제

군부대에서 레이더 탐지기를 가지고 있습니다. 이 레이더 탐지기의 탐지 지역을 X라고 하겠습니다. X범위안에 비행기가 나타나면 99퍼센트의 확률로 알람을 발생시킵니다. 하지만 10퍼센트의 확률로 X범위에 비행기가 없어도 알람을 발생시킵니다.

2020년 7월 20일
·
0개의 댓글
post-thumbnail

생일 문제

목표 사건 $A$의 정의는 다음과 같습니다.$A={K명의 \\;집단 \\;중에서 \\;최소한 \\;두 \\;명이 \\;같은 \\;생일을 \\;같는 \\;사건}$

2020년 7월 20일
·
0개의 댓글
post-thumbnail

Taylor Series

테일러 급수, 매클로린 급수, 자연상수의 근사다항식에 대해서 알아보겠습니다.

2020년 7월 16일
·
0개의 댓글

연속 확률 변수

이상화 교수님의 확률 및 통계 5강 '이산 확률 변수와 연속 확률 변수' 강의를 듣고 간단하게 내용을 정리해보도록 하겠습니다.0과 1사이의 '모든' 실수값에서 '0.5'를 뽑을 확률을 정의해보자. 0과 1사이에는 무수히 많은 숫자들이 있을 것이고. 그 중에서 0.5라는

2020년 5월 21일
·
0개의 댓글

조건부확률

조건부 확률은 두 확률 P(A),P(B)은 아래의 수식을 따른다.P(B|A)=P(A,B)/P(A) , P(A,B)=P(A)P(B|A)P(스팸|입력텍스트) =P(스팸,입력텍스트)/P(입력텍스트)P(정상|입력텍스트) =P(정상,입력텍스트)/P(입력텍스트)P(입력텍스

2020년 4월 19일
·
0개의 댓글

통계학입문 :: 도수분포와 평균

통계? > 데이터 자체, '현실 그 자체' 에서 특징이나 반복되는것을 이끌어 내는 것 축약 > 데이터를 어떤 기준으로 정리정돈하여 의미있는 정보만을 추출하는 것 축약의 2가지 방법 - 그래프로 만들기 - 숫자 하나로 특징을 대표하기 (a.k.a 통계량)

2019년 2월 10일
·
1개의 댓글