수학적 개념이해 - 미분
미분의 개념
- 평균 변화율
- b−af(b)−f(a)
- 순간 변화율
- f′(a)=limb→ab−af(b)−f(a)
- 평균 변화율의 극한 값
- b점이 a점으로 한없이 가까워질 때, a점에서의 순간변화율
- a점에서의 접선의 기울기
- 다항함수 미분 및 미분 기본 공식
- f(x)=c⇒f′(x)=0, c는 상수
- f(x)=xn⇒f′(x)=nxn−1, n은 자연수
- (참고) f(x)=xk⇒f′(x)=kxk−1, ksms 유리수
- {cf(x)}′=cf′(x)
- {f(x)±g(x)}′=f′(x)±g′(x)
- 곱의 미분
- {f(x)g(x)}′=f′(x)g(x)+f(x)g′(x)
- 합성함수 미분
- f(g(x))′=f′(g(x))g′(x)
- 지수함수 미분
- {ex}′=ex
- {ax}′=axlna
- 로그함수 미분
- {lnx}′=x1
- {logax}′=xlna1
미분의 활용
- 극댓값, 극솟값
- 도함수를 통하여 미분가능한 함수의 극댓값, 극솟값을 구할 수 있음
Likelihood
- Likelihood function (가능도함수/우도함수)
- 모평균이 μ0일 때 표본x가 얻어질 확률
- 가능도함수를 최대로 만드는 μ0^를 모평균으로 추정
- 확률분포함수(Probability distribution function)
- 모수를 알 때, 확률변수의 실현값을 예측하고자 함
- 종류
- 확률밀도함수(Probability density function) - 연속형 확률변수의 확률 분포함수
- 확률질량함수(probability mass function) - 이산형 확률변수의 확률 분포함수
- f(x)=P(X=x)
- 누적분포함수(Cumulative distribution function) - 누적 확률 분포함수
- F(x)=P(X≤x)
- 가능도함수(Likelihood function)
- 확률변수의 실현값을 알 때(데이터가 있을 때), 모수를 추정하고자 함
- Probability density function
- 평균μ0, 분산1을 독립 정규분포를 따르는 확률변수 Xi의 확률분포함수(확률밀도함수)
- f(xi)=(2π⋅11)exp(−2⋅1(xi−μ0)2)
- X1=x1,X2=x2,X3=x3, 3개의 자료가 있을 때, 확률분포함수
- f(x1,x2,x3)=(2π⋅11)3exp(−2⋅1(x1−μ0)2+(x2−μ0)2+(x3−μ0)2)
- Likelihood function
- 동일한 함수이나, μ0를 변수로 인식
- L(μ0;x1,x2,x3)=(2π⋅11)3exp(−2⋅1(μ0−x1)2+(μ0−x2)2+(μ0−x3)2)
- X1=1,X2=2,X3=3일 때,
- L(μ0;1,2,3)=(2π⋅11)3exp(−2⋅1(μ0−1)2+(μ0−2)2+(μ0−3)2)$
- Maximum Likelihood Estimator(MLE)
- 정의: Likelihood를 최대롤 만드는 모수의 값
- 주로 모수에 hat을 붙여 (μ^)표현
- Likelihood는 μ0에 대한 함수
- μ^= 최댓값을 가지는, 극댓값을 가지는, Likelihood를 μ0로 미분해서 0을 만드는 값
미분의 활용 - MLE
- μ0 MLE 구하기
- Likelihood 구성
- L(μ;1,2,3)=(2π⋅11)3exp(−2⋅1(μ0−1)2+(μ0−2)2+(μ0−3)2)
- 미분하기 용이하도록 log Likelihood 구성
- logL(μ0;1,2,3)=−23log(2π)−21((μ0−1)2+(μ0−2)2+(μ0−3)2)
- 미분 실행
- δμ0δlogL(μ0;1,2,3)=−21(2(μ0−1)+2(μ0−2)+2(μ0−3))
- 미분한 함수가 0이 되게 하는 μ0^를 구해냄
- −21(2(μ0^−1)+2(μ0^−2)+2(μ0^−3))=0
- 3μ0^=1+2+3
- μ0^=2
- σ2 MLE 구하기
- Likelihood 구성, λ=σ2
- L(μ;1,2,3)=(2π⋅λ1)3exp(−2⋅λ(μ0−1)2+(μ0−2)2+(μ0−3)2)
- 미분하기 용이하도록 log Likelihood 구성
- logL(μ0;1,2,3)=−23log(2πλ)−2λ1((μ0−1)2+(μ0−2)2+(μ0−3)2)
- 미분 실행
- δλδlogL(μ0;1,2,3)=−23⋅λ1+21(λ)−2((μ0−1)2+(μ0−2)2+(μ0−3)2)
- 미분한 함수가 0이 되게 하는 λ^를 구해냄
- −23⋅λ^+21((μ0−1)2+(μ0−2)2+(μ0−3)2)=0
- λ^=31((μ0−1)2+(μ0−2)2+(μ0−3)2)
머신러닝과 데이터 분석 A-Z 올인원 패키지 Online. 👉 https://bit.ly/3cB3C8y