
로지스틱 회귀와 최대 가능도 추정법의 관계를 단계별로 설명
L(θ₀,θ₁,θ₂) = P(구매|x₁)^y₁ × (1-P(구매|x₁))^(1-y₁) ×
P(구매|x₂)^y₂ × (1-P(구매|x₂))^(1-y₂) × ...
예시 데이터로 보면:
데이터1: 25세, 250만원, 구매(y=1)
데이터2: 35세, 180만원, 미구매(y=0)
데이터1의 likelihood:
데이터2의 likelihood:
즉, 최대 가능도 추정법은 "관찰된 데이터가 나올 확률이 가장 높아지는 θ₀, θ₁, θ₂ 값을 찾는 방법"입니다.
쉽게 말하면:
1. 우리가 가진 데이터를 가장 잘 설명하는
2. 로지스틱 회귀 모델의 파라미터(θ₀, θ₁, θ₂)를 찾는 것!
x₁에 대해 명확한 설명.
x₁은 "첫 번째 사람의 데이터"를 의미합니다.
예를 들어, x₁ = (나이: 25살, 월소득: 250만원)
따라서:
P(구매|x₁) = 1/(1 + e^(-θ₀ - θ₁×25 - θ₂×250))
이렇게 쓴 이유는:
다른 사람(x₂)이라면:
x₂ = (나이: 35살, 월소득: 180만원)
P(구매|x₂) = 1/(1 + e^(-θ₀ - θ₁×35 - θ₂×180))
즉:
📊 예시 데이터:
x₁: (25살, 250만원) → y₁=1(구매함)
x₂: (35살, 180만원) → y₂=0(구매안함)
x₃: (28살, 300만원) → y₃=1(구매함)
L(θ₀,θ₁,θ₂) = P(구매|x₁) × (1-P(구매|x₂)) × P(구매|x₃)
ln L = ln(P(구매|x₁)) + ln(1-P(구매|x₂)) + ln(P(구매|x₃))
2) 경사상승법으로 θ₀,θ₁,θ₂ 업데이트:
θ₀ = θ₀ + α×(∂/∂θ₀)(ln L)
θ₁ = θ₁ + α×(∂/∂θ₁)(ln L)
θ₂ = θ₂ + α×(∂/∂θ₂)(ln L)
즉, likelihood는: