[확률/통계] 곱셈 구조 / 비율 구조

JAsmine_log·2025년 9월 1일
0

곱셈 구조 / 비율 구조

"곱셈 구조"와 "비율 구조"는 기하평균조화평균이 각각 등장하는 상황에서 중요한 개념

1. 곱셈 구조란? → 기하평균이 어울림

정의:

  • 데이터들이 곱해지는 방식으로 누적되는 상황
  • 또는 비율(%)이 연속적으로 적용되는 경우

예시:

연평균 성장률 (Compound Annual Growth Rate, CAGR)

예: 한 회사의 연도별 매출 증가율이 다음과 같다:

  • 1년차: +10% → 1.10
  • 2년차: +20% → 1.20
  • 3년차: -10% → 0.90

전체 누적 성장률 = 1.101.200.90=1.1881.10 \cdot 1.20 \cdot 0.90 = 1.188

평균 성장률은?

GM=(1.101.200.90)1/31.059GM = (1.10 \cdot 1.20 \cdot 0.90)^{1/3} \approx 1.059

즉, 약 5.9%씩 매년 성장한 셈


NLP에서의 확률 구조

  • 확률도 0~1 사이의 곱셈 구조로 누적된다:

    P(w1,,wN)=P(w1)P(w2w1)P(w_1,\dots,w_N) = P(w_1) \cdot P(w_2|w_1) \cdot \dots

    → 그래서 기하평균을 쓰는 게 자연스러움


2. 비율 구조란? → 조화평균이 어울림

정의:

  • 데이터가 비율의 역수 구조로 되어 있을 때
  • 특히 "분모에 비율이 있는 식"에서 주로 등장

대표 예시:

평균 속도 계산

어떤 사람이:

  • 60km/h로 1시간 이동
  • 20km/h로 1시간 이동

산술평균 → (60+20)/2=40(60 + 20)/2 = 40km/h ❌
하지만 거리 기준으로 평균 속도를 계산하면:

평균속도=2160+120=30 km/h\text{평균속도} = \frac{2}{\frac{1}{60} + \frac{1}{20}} = 30 \text{ km/h}

조화평균이 정답!
이유는 속도가 거리 ÷ 시간이고, 시간 기준으로 역수 합이 생기기 때문이다.

F1-score (NLP/ML에서 많이 쓰임)

  • Precision (정밀도), Recall (재현율)이 있을 때:
F1=21precision+1recallF1 = \frac{2}{\frac{1}{\text{precision}} + \frac{1}{\text{recall}}}

→ 즉, 조화평균


차이점

구조특징어울리는 평균예시
덧셈 구조단순 누적산술평균시험 점수 평균
곱셈 구조비율이 곱해짐기하평균복리이자, 확률, 성장률
비율 구조 (역수)분모가 중요함조화평균평균 속도, F1-score
profile
Everyday Research & Development

0개의 댓글