이항계수

Log·2023년 3월 28일
0

수리통계학

목록 보기
1/1

문서 목적

해당 문서는 수리통계학을 공부하면서, 해당 내용이 실생활에 어떻게 쓰이는지 알고 싶어서 각 항목에 따라 실생활에 대한 사용을 정리할 예정이다.

실생활에서 사용 대부분 chatgpt의 질문을 기반으로 작성되었습니다.

이항계수

(x+y)n(x+y)^{n}의 이항 전개의 xnryrx^{n-r}\cdot y^{r}의 계수를 (nr)\binom{n}{r}이라고 한다.
출처 : John E. Freund의 수리통계학 실제와 응용

이항계수는 이항식을 이항정리로 전개했을 때 각 항의 계수를 나타낸 것으로, 조합을 통해 이항계수를 구할 수 있다.

실생활에서 사용

유전학

유전학에서는 이항계수를 특정 유전자형을 구성하는 대립 유전자의 빈도를 고려하여 모집단에서 특정 유전자형이 발생할 확률을 계산하는데 사용한다.

금융

금융에서 이항계수는, 특정 투자전략에 대한 가능한 결과의 수를 계산하는데 사용할 수 있으며 거래의 수와 각 거래의 손익 발생 확률에 기초한다.

컴퓨터 과학

컴퓨터 과학에서는 항복 집합의 가능한 조합의 수를 계산하는 데 사용될 수 있으며, 암호 생성 및 데이터 암호화와 같은 작업에 유용하다.

일상 생활

이항 계수 사용에 대해 대표적인 예시로는 품질 관리이다. 이항 계수는 제품 표본에서 특정 개수의 불량품 확률을 계산하는데 사용될 수 있다.
예를 들어 1000개의 제품을 생산하고, 단일 품목이 불량일 확률이 0.01이라고 가정하자. 그렇다면, 100개의 표본을 랜덤하게 선택할 경우, 정확하게 2개의 불량품을 뽑을 확률은 아래와 같다.
P(X=2)=(2100)(0.01)2(9898)(10.01)98=49500.00010.3735=0.1848825P(X=2) = \binom{2}{100} (0.01)^{2} \cdot \binom{98}{98}(1-0.01)^{98} = 4950\cdot0.0001\cdot0.3735=0.1848825
이 결과로 100개의 품목을 추출한 표본에서 정확하게 2개의 불량품을 찾을 확률은 약 18.5%라는 것을 얻을 수 있고, 이항 계수는 품질 관리에서 샘플 검사 결과를 기반으로 제품 배치의 적합성에 대한 실시간 결정을 내리는 데 사용된다.

기타

책에서의 연습문제 등에서 나온 이론

스털링의 공식

n이 클 때, n!은 다음과 같은 방법으로 근사할 수 있다.
n! 2πn(ne)nn! \ \approx \sqrt{2\pi n}\big(\frac{n}{e}\big)^{n}

점유 이론(occupancy theory)

고정된 수의 객체를 고정된 수의 컨테이너에 분배하는 동시에 각 컨테이너에 적어도 하나의 객체가 있는지 확인하는 방법을 다루는 수학 문제이다.
예를 들어, 6개의 서로 다른 색상의 공과 3개의 구별할 수 없는 상자가 있다고 가정했을 때, 각 상자에 적어도 하나의 공이 있도록 공을 상자에 넣는 방법은 몇가지 일까?
해당 답은 점유 공식에 의해 제공되는데, k개의 컨테이너에 n개의 객체를 분배하는 방법의 수는 아래와 같은 공식에 의해 10가지 방법이 나온다. 따라서 공을 상자에 분배하는 10가지 방법이 있으므로 각 상자에 공이 적어도 하나 있다.
O(n,k)=(n1k1)O(n, k) = \binom{n-1}{k-1}

실생활 사용

점유 이론의 실제 사용의 예는 생태학의 점유 데이터 분석에 있다. 생태학는 점유 데이터를 이용하여 다양한 서식지에서 종의 분포와 풍부함을 연구하고자 한다. 이러한 상황에서 점유 이론은 종 발생 패턴을 모델링하고 주어진 지역에서 종의 수를 추정하는 데 유용한 프레임워크를 제공한다.

예를 들어 일련의 조사에서 각 종이 발견된 횟수를 기반으로 숲에 있는 새 종의 수를 추정한다고 가정하자. 각 종이 각 조사에 존재할 확률이 있다고 가정하면 이항 분포를 사용하여 탐지 과정을 모델링할 수 있다. 그런 다음 점유 이론을 사용하여 관찰된 데이터를 기반으로 숲의 총 종 수를 추정할 수 있다.

구체적으로 각 종의 탐지 확률이 같다고 가정하고 적어도 하나의 종이 탐지된 n개 조사 중 k개를 관찰하면 점유 공식을 사용하여 추정된 종 수(S)를 계산할 수 있다.
S=kln(nk)S = k \cdot \ln(\frac{n}{k})

이 공식은 추정된 종의 수는 전체 조사 수뿐만 아니라 적어도 하나의 종이 감지된 조사 수에 따라 다르다는 것을 의미한다. 이 공식을 사용하여 생태학자는 숲에 있는 새 종의 수를 추정하고 다양한 서식지와 지역에 걸쳐 추정치를 비교할 수 있다.

profile
열심히 정리하는 습관 기르기..

0개의 댓글