아래 내용은 네이버 AI precourse 강의를 개인 공부를 위해 정리한 내용입니다.
딥러닝에서 확률론이 필요한 이유: 분산 및 불확실성을 최소화하기 위해
1. 회귀 분석: 손실 함수로 사용되는 L2 Norm에서 예측오차의 분산을 최소화하는 방향으로 학습하기 위해
2. 분류 문제: 교차엔트로피(cross-entropy)에서 모델 예측의 불확실성을 최소화하는 방향으로 학습하기 위해
𝒳: 입력 데이터의 공간
𝒴: 출력 데이터의 공간
𝒳×𝒴: 입력 데이터 공간과 출력 데이터 공간의 곱집합(cartesian product)
𝒟: 데이터 공간에서 데이터를 추출하는 확률 분포
데이터 분포가 중요한 이유
학습 데이터의 생성: 모델이 학습할 데이터는 이 분포 𝒟로부터 샘플링된다.일반화: 모델이 새로운 데이터를 얼마나 잘 예측할 수 있는지는 이 분포𝒟를 얼마나 잘 학습했는지에 달려 있다. 학습 데이터가 분포 𝒟를 잘 반영하고 있다면, 모델은 새로운 데이터에 대해 더 잘 일반화할 수 있다.이산적(독립적이고 구분 가능한)인 경우확률질량함수(PMF, Probability Mass Function)가 사용됨
연속적(연속된 범위 내의 값)인 경우확률밀도함수(PDF, Probability Density Function)가 사용됨
(참고) 이산확률변수, 연속확률변수 둘 다 아닌 확률변수도 존재함.
(참고) 이러한 확률 분포는 데이터 공간 𝒳×𝒴가 아닌, 데이터 분포 𝒟에 의해 결정됨
그 이유는 데이터 공간 𝒳×𝒴는 입력과 출력의 가능한 모든 조합을 포함하지만, 각 조합이 나타날 확률을 제공하지 않기 때문이다. 반면, 데이터 분포 𝒟는 이러한 조합들이 실제로 어떻게 분포되어 있는지, 즉 각 입력-출력 쌍이 나타날 확률을 제공한다. 따라서, 데이터의 실제 분포와 그 특성을 이해하기 위해서는 데이터 공간 𝒳×𝒴뿐만 아니라, 데이터 분포 𝒟가 필요하다.
결합 분포 𝑃(𝑋,𝑌)는 우리가 실제로 관찰하는 데이터가 어떻게 입력과 출력의 쌍으로 나타나는지를 설명하는 모델입니다. 이는 데이터가 어떤 방식으로 분포되어 있는지를 이해하는 데 중요합니다.
두 개 이상의 확률변수가 동시에 특정 값을 가질 확률을 나타내는 분포𝑃(𝑋=𝑥, 𝑌=𝑦) 여러 확률변수 간의 상관관계를 이해하는 데 사용됨결합분포 𝑃(𝑋,𝑌)는 확률분포 𝒟를 모델링함.𝑃(𝑋=𝑥, 𝑌=𝑦) 𝑥, 𝑦 = (1, 2, 3, 4, 5, 6); 주사위 값
다변량 확률 분포에서 특정 변수의 분포를 다른 변수와 상관없이 계산한 확률분포 (특정 변수 하나만 고려한 분포)𝑦에 대한 정보는 주지 않는다는 특징이 있음.
입력변수 𝑋에 대해 정답이 𝑦일 확률조건부확률분포는 특정 경우(y=1)만 counting함
소프트맥스 함수는 각 클래스 에 대해 다음과 같은 조건부 확률 를 계산
(참고) 구체적인 과정
1. 특징 추출: 입력 데이터 𝑥로부터 특징 패턴 𝜙(𝑥)를 추출합니다.
2. 선형 결합: 특징 패턴 𝜙(𝑥)에 가중치 행렬 𝑊를 곱하고 편향 𝑏를 더하여 선형 결합을 만듦.
𝑧 = 𝑊𝜙(𝑥) + 𝑏
3. 소프트맥스 함수: 이 선형 결합 𝑧에 소프트맥스 함수를 적용하여 각 클래스에 속할 확률을 계산.
조건부기대값 𝐸[𝑦∣𝑥]는 주어진 입력 𝑥에 대해 출력 𝑦의 평균을 의미
이는 𝑥라는 조건 하에서 𝑦가 어떤 값을 가질지의 평균값을 나타냄
확률 밀도 함수(적분)를 통해 𝑦의 평균값을 계산
(참고) 조건부기대값과 손실함수의 관계
주어진 𝑥에 대해 손실 함수 를 최소화하는 최적의 함수 𝑓(𝑥)는 바로 조건부 기대값 입니다. 즉, 다음과 같은 관계가 성립합니다: 𝑓(𝑥)=𝐸[𝑦∣𝑥]
(참고) 기대값이란?

현재 가지고 있는 데이터를 이용해 기대값을 계산하기 위해서는 몬테카를로(Monte Carlo) 샘플링 방법을 사용해야 한다.반복된
무작위 추출을 이용하여 함수의 값을 근사하는 알고리즘을 의미한다.
확률변수가 상호독립적일 때, 모두 동일한 확률분포를 가진다면 기대값을 랜덤하게 뽑은 n개 샘플의 평균치와 유사하다! (당연히 N이 커질수록 더욱 유사해짐)
출처: https://think-tech.tistory.com/29 [자윰이의 성장일기:티스토리]

독립추출만 보장된다면, 대수의 법칙에 의해 수렴성을 보장함