곱셈 구조 / 비율 구조
"곱셈 구조"와 "비율 구조"는 기하평균과 조화평균이 각각 등장하는 상황에서 중요한 개념
1. 곱셈 구조란? → 기하평균이 어울림
정의:
- 데이터들이 곱해지는 방식으로 누적되는 상황
- 또는 비율(%)이 연속적으로 적용되는 경우
예시:
연평균 성장률 (Compound Annual Growth Rate, CAGR)
예: 한 회사의 연도별 매출 증가율이 다음과 같다:
- 1년차: +10% → 1.10
- 2년차: +20% → 1.20
- 3년차: -10% → 0.90
전체 누적 성장률 = 1.10⋅1.20⋅0.90=1.188
→ 평균 성장률은?
GM=(1.10⋅1.20⋅0.90)1/3≈1.059
즉, 약 5.9%씩 매년 성장한 셈
NLP에서의 확률 구조
-
확률도 0~1 사이의 곱셈 구조로 누적된다:
P(w1,…,wN)=P(w1)⋅P(w2∣w1)⋅…
→ 그래서 기하평균을 쓰는 게 자연스러움
2. 비율 구조란? → 조화평균이 어울림
정의:
- 데이터가 비율의 역수 구조로 되어 있을 때
- 특히 "분모에 비율이 있는 식"에서 주로 등장
대표 예시:
평균 속도 계산
어떤 사람이:
- 60km/h로 1시간 이동
- 20km/h로 1시간 이동
산술평균 → (60+20)/2=40km/h ❌
하지만 거리 기준으로 평균 속도를 계산하면:
평균속도=601+2012=30 km/h
→ 조화평균이 정답!
이유는 속도가 거리 ÷ 시간이고, 시간 기준으로 역수 합이 생기기 때문이다.
F1-score (NLP/ML에서 많이 쓰임)
- Precision (정밀도), Recall (재현율)이 있을 때:
F1=precision1+recall12
→ 즉, 조화평균
차이점
| 구조 | 특징 | 어울리는 평균 | 예시 |
|---|
| 덧셈 구조 | 단순 누적 | 산술평균 | 시험 점수 평균 |
| 곱셈 구조 | 비율이 곱해짐 | 기하평균 | 복리이자, 확률, 성장률 |
| 비율 구조 (역수) | 분모가 중요함 | 조화평균 | 평균 속도, F1-score |