[머신러닝을 위한 기초수학] - 확률

Yerin Kim·2023년 4월 19일
0
post-thumbnail

확률

  1. random experiments(무작위 실험)
    : 이는 결과를 확실하게 예측할 수 없으며, 대신 여러 가능한 결과가 있는 실험을 의미
    ex. 동전 던지기 / 주사위 던지기 / 카드 뽑기 / 로또 등
  2. sample space(표본 공간)
    : 표본 공간은 무작위 실험의 모든 가능한 결과의 집합 (=모든 확률을 모은 것)
    ex. { 동전 앞 , 동전 뒤 } / { 1, 2, 3 ... , 6 }
  3. outcomes(결과)
    : 결과는 무작위 실험에서 발생하는 특정 결과물 (=sample space가 가지고 있는 원소)
  4. events(사건)
    : 사건은 무작위 실험의 표본 공간의 부분 집합
    이는 어떤 조건이나 기준을 만족하는 결과의 집합을 말한다. (=outcomes에서 특정결과를 모아둔 사건)
    ex. { x | x가 2의 배수 }
  5. probabilities(확률)
    : 확률은 사건이 발생할 가능성의 숫자적 측정 값으로, 일반적으로 0과 1 사이의 숫자로 표현
    사건의 확률은 그 사건을 만족하는 결과의 수를 가능한 결과의 전체 수로 나눈 비율이다.

Equally Likely Outcomes (같은 확률의 결과)
표본 공간 내의 모든 결과가 동일한 확률로 발생할 가능성이 있는 경우
= Outcomes들이 서로 동일하게 나온다.

이러한 경우, 각 결과는 동등한 가치를 가지므로, 각 결과에 대한 확률은 모두 같다.
이 개념은 공정한 동전 던지기, 주사위 굴리기 등과 같은 간단한 예에서 자주 사용된다
예를 들어, 공정한 6면체 주사위를 굴려서 나올 수 있는 결과는 1에서 6까지의 수이며,
이러한 결과는 모두 동일한 확률로 발생한다. 따라서 각 결과에 대한 확률은 1/6이다!


P(A) = |A| / |S|

위의 식에서 P(A)는 사건 A가 발생할 확률을 나타내며, |A|는 사건 A에 속하는 결과의 개수를,
|S|는 전체 표본 공간 S에 속하는 결과의 개수를 나타낸다.

이 식은 확률의 정의에 기반하여, 사건 A가 발생할 확률은 사건 A에 속하는 결과의 개수를 전체 표본 공간 S에 속하는 결과의 개수로 나눈 것!
이 식은 모든 경우의 수를 고려하여 각 결과의 확률을 계산하는 데 사용된다.


P(A ∩ B) = |A ∩ B| / |S|

위의 식에서 P(A ∩ B)는 사건 A와 사건 B가 모두 발생할 확률을 나타내며, |A ∩ B|는 사건 A와 B에 모두 속하는 결과의 개수를, |S|는 전체 표본 공간 S에 속하는 결과의 개수를 나타낸다.
이 식은 교집합을 이용하여 사건 A와 B가 모두 발생하는 경우의 확률을 계산한다.


P(A ∪ B) = |A ∪ B| / |S|

위의 식에서 P(A ∪ B)는 사건 A 또는 사건 B가 발생할 확률을 나타내며, |A ∪ B|는 사건 A와 B 중 어느 하나 이상에 속하는 결과의 개수를, |S|는 전체 표본 공간 S에 속하는 결과의 개수를 나타낸다.
이 식은 합집합을 이용하여 사건 A 또는 B 중 어느 하나 이상이 발생하는 경우의 확률을 계산한다.


P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

A와 B의 합집합의 확률은 각각의 사건의 확률의 합에서 교집합의 확률을 뺀 것과 같다.

여기서 P(A)는 사건 A의 확률을 나타내고, P(B)는 사건 B의 확률을 나타내며,
P(A ∩ B)는 사건 A와 B의 교집합의 확률을 나타낸다.

이 공식은 사건 A와 B가 서로 배반적이지 않을 때 적용된다.
즉, 둘 다 동시에 발생할 수 있는 경우를 말한다.

A와 B가 서로 배반적인 경우에는 P(A ∩ B) = 0이므로 공식은 다음과 같이 단순화될 수 있다.

P(A ∪ B) = P(A) + P(B)

이는 사건 A와 B가 동시에 발생할 수 없기 때문에, 교집합의 확률이 0이 된다.

즉 위의 경우 다음과 같이 설명할 수 있다.

A와 B의 교집합은 공집합 (∅)이므로 P(A ∩ B) = 0
A와 B가 서로 배반적이기 때문에, A와 B 중 하나의 사건이 발생할 확률은 두 사건의 확률의 합과 같다.
따라서 P(A ∪ B) = P(A) + P(B)가 됩니다.



예상 시험 문제

  1. 표본 공간이 {1, 2, 3, 4, 5}로 주어졌을 때, 사건 A가 {2, 4}, 사건 B가 {3, 4, 5}일 때, 사건 A와 B의 교집합에 속하는 결과의 개수와 확률을 계산하세요.
P(A ∩ B) = |A ∩ B| / |S| = 1/5
  1. 주사위를 두 번 던져서 나온 두 숫자의 합이 8이 되는 사건의 확률을 계산하세요.
주사위를 두 번 던져서 나올 수 있는 모든 경우는 36가지이다.
합이 8이 되는 경우는 (2,6), (3,5), (4,4), (5,3), (6,2)로 이 경우의 수는 5
따라서, 이 사건의 확률은 5/36이다.
  1. 한 가족의 아이들 중에 딸이 하나일 확률은 얼마인가요? (가정: 딸과 아들이 태어날 확률은 같다.)
가족의 첫 번째 아이가 딸일 확률은 1/2이고, 두 번째 아이가 딸일 확률도 1/2이다.
이 두 확률을 곱하면, 첫 번째 아이와 두 번째 아이가 모두 딸일 확률은 1/2 x 1/2 = 1/4
딸이 하나일 확률은 첫 번째 아이가 딸이고 두 번째 아이가 아들인 경우와,
첫 번째 아이가 아들이고 두 번째 아이가 딸인 경우 두 가지이다.
이 두 확률을 더하면, 딸이 하나일 확률은 1/4 + 1/4 = 1/2가 된다.
  1. 한 학급의 학생 중에서 15명이 축구를 하고 10명이 농구를 합니다
    그 중에서 5명은 축구와 농구 모두 합니다. 이 때, 적어도 한 종류의 스포츠를 하는 학생의 비율은 얼마인가요?
축구나 농구를 하는 학생의 비율은 (15 + 10 - 5) / (15 + 10) = 20 / 25 = 0.8
따라서 적어도 한 종류의 스포츠를 하는 학생의 비율은 1 - 0.8 = 0.2이다.
  1. 어떤 회사에서 제품을 생산하는 두 공장 A와 B가 있습니다.
    공장 A에서 생산된 제품 중에서 5%가 불량품입니다.
    공장 B에서 생산된 제품 중에서 8%가 불량품입니다.
    제품이 공장 A에서 생산될 확률이 0.6일 때, 어느 공장에서 생산된 제품인지 모르는 상태에서
    임의로 하나의 제품을 뽑았을 때, 이 제품이 불량품일 확률은 얼마인가요?
제품이 공장 A에서 생산될 확률이 0.6이므로, 공장 B에서 생산될 확률은 1 - 0.6 = 0.4
불량품일 확률은 P(불량품) = P(불량품|A)P(A) + P(불량품|B)P(B)
= 0.05 x 0.6 + 0.08 x 0.4
= 0.057
  1. 어떤 대학의 수학과와 전산학과 중에서 적어도 한 과를 수강하는 학생의 비율은 각각 60%와 70%입니다
    수학과와 전산학과를 모두 수강하는 학생의 비율은 30%입니다.
    이 때, 이 대학에서 수학과와 전산학과 모두 수강하는 학생의 비율은 얼마인가요?
수학과 또는 전산학과 중에서 적어도 한 과를 수강하는 학생의 비율은
1 - (1 - 0.6)(1 - 0.7) = 0.88
수학과와 전산학과 모두 수강하는 학생의 비율은 0.3
이 때, 수학과나 전산학과를 수강하는 학생 중에서
수학과와 전산학과 모두 수강하는 학생의 비율은 0.3 / 0.88 = 0.34
  1. 어떤 농장에서 5개의 사과 중에서 2개가 매우 작습니다.
    다른 6개의 사과 중에서 1개가 매우 작습니다.
    농장에서 임의로 하나의 사과를 뽑았을 때, 이 사과가 매우 작은 사과인지 아닌지를 판단하는 실험을 하려고 합니다.
    이 때, 매우 작은 사과를 뽑을 확률은 얼마인가요?
매우 작은 사과는 2 + 1 = 3개이므로, 매우 작은 사과를 뽑을 확률은 3 / (5 + 6) = 3 / 11
profile
내일의 나는, 오늘의 도전으로 만들어진다!

0개의 댓글