통계 (2)

Myeongsu Moon·2024년 10월 28일
0

제로베이스

목록 보기
12/95

1-3 확률이론 - 확률

  • 확률: 모든 경우의 수에 대한 특정 사건이 발생한는 비율
  • 확률의 고전적 정의: 그것이 일어날 수 있는 경우의 수 대 가능한 모든 경우의 수의 비
  • 표본 공간: 어떤 실험에서 나올 수 있는 모든 가능한 결과들의 집합

1. 확률의 성질

  • 합사건: 사건A 또는 사건B가 일어날 확률
  • 곱사건: 사건A와 사건B가 동시에 일어날 확률
  • 배반사건: 사건A와 사건B가 동시에 일어날수 없는 경우
  • 여사건: 사건A가 일어나지 않을 확률

1) 확률의 덧셈법칙

P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A \cap B)

2) A와 B가 배반사건이면

P(AB)=0P(A \cap B) = 0

3) A의 여사건이 P(Ac)P(A^c) 이면

P(Ac)+P(A)=1P(A^c) + P(A) = 1

2. 조합과 순열

  • !(factorial): n개를 일렬로 늘여 놓은 경우의 수는 n!n!
  • 순열(permatation): 순서를 고려하여 n개 중 r개를 뽑아서 배열하는 경우의 수
  • 조합(combination): 순서를 고려하지 않고 n게 중 r개를 뽑아서 배열하는 경우의 수
  • 조건부 확률: 어떤 사건 A가 발생한 상황에서 또 하나의 사건 B가 발생할 확률
  • 확률의 곱셈법칙: P(AB)=P(A)×P(BA)=P(B)×P(AB)P(A \cap B) = P(A) \times P(B | A) = P(B) \times P(A | B)
  • 베이즈 정리 : P(BA)=P(AB)P(B)P(A)P(B | A) = \frac{P(A | B) \cdot P(B)}{P(A)}

1-4 확률이론- 확률변수

  • 확률 변수: 표본 공간에서 각 사건에 실수를 대응시키는 함수
    -> 하나의 사건에 대하여 하나의 값을 가지며, 실험의 결과에 의하여 변함
    -> 일반적으로 확률 변수는 대문자, 확률변수의 특정값을 소문자로 표현

  • 확률 변수의 평균(기대값): E(X)=i=1nxiP(xi)=x1P(x1)+x2P(x2)++xnP(xn)E(X) = \sum_{i=1}^n x_i P(x_i) = x_1 P(x_1) + x_2 P(x_2) + \cdots + x_n P(x_n)

  • 확률변수의 분산: $$
    \text{Var}(X) = \frac{1}{N} \sum (x_i - \mu)^2

  • 기대값의 성질
    -> a,b 가 상수이고, X, Y를 임의의 확률 변수라고 할 때
    1) E(a)=aE(a) = a
    2) E(aX)=aE(X)E(aX) = aE(X)
    3) E(aX+b)=aE(X)+bE(aX + b) = aE(X) + b
    4) E(aX±bY)=aE(X)±bE(Y)E(aX \pm bY) = aE(X) \pm bE(Y)
    5) ( X, Y )가 독립일 때 E(XY)=E(X)E(Y)E(XY) = E(X) \cdot E(Y)

  • 분산의 성질
    -> a,b 가 상수이고, X, Y를 임의의 확률 변수라고 할 때
    1) Var(a)=0\text{Var}(a) = 0
    2) Var(aX)=a2Var(X)\text{Var}(aX) = a^2 \text{Var}(X)
    3) Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)\text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y) + 2 \text{Cov}(X, Y)
    4) Var(aX±bY)=a2Var(X)±b2Var(Y)+2Cov(X,Y)\text{Var}(aX \pm bY) = a^2 \text{Var}(X) \pm b^2 \text{Var}(Y) + 2 \text{Cov}(X, Y)
    5) ( X, Y )가 독립일 때 Var(XY)=0\text{Var}(XY) = 0
    6) Var(X)=E(X2)[E(X)]2\text{Var}(X) = E(X^2) - [E(X)]^2

  • 공분산: 2개의 확률변수의 선형 관계를 나타내는 값

    Cov(X,Y)=E[(XE(X))(YE(Y))]=i=1n(XiX)(YiY)n1\text{Cov}(X, Y) = E\left[(X - E(X))(Y - E(Y))\right] = \frac{\sum_{i=1}^n (X_i - \overline{X})(Y_i - \overline{Y})}{n - 1}

이 글은 제로베이스 데이터 취업 스쿨의 강의 자료 일부를 발췌하여 작성되었습니다

0개의 댓글