*Sapientia a Dei님의 유튜브를 참고하여 정리했습니다.
오늘은 A/B 테스트 프로젝트 진행 첫 날입니다.
프로젝트 진행을 위해 필요한 개념들을 다시 정리합니다.
TIL
- 결정론적 의사결정
- 통계적 의사결정
- 평균과 표준편차
1. 결정론적 의사결정
- 결정론적 의사결정과 대비되는 의사결정 방법
- 결정론적 의사결정은 변화의 원인을 결정론적으로 확신하는 의사결정을 의미한다.
- 예를 들어, 매출이 1,000만원이 오르면 새로운 판매전략이 그 원인이라고 생각하는 것이 결정론적 의사결정이다.
- 또는, 수학점수가 오른 이유를 학원을 다녔기 때문으로 확신하는 것을 결정론적 의사결정이라고 한다.
2. 통계적 의사결정
- 어떤 사건이 우연히 발생할 확률을 묻는 것으로 시작하는 것을 말한다.
- 만약 어떤 사건이 우연히 발생할 확률이 극히 낮다면, 해당 사건이 어떤 요인의 영향을 받았다고 가정할 수 있는 것이다.
- 판매전략의 변화로 매출이 우연히 1,000만원 오를 가능성은 얼마일지, 학원을 다녀서 수학점수가 우연히 10점 오를 가능성은 얼마일지 묻는 것이 통계적 사고이다.
3. 데이터를 설명하는 대표적인 특징들(대표값)
- 평균
- 중간값
- 최빈값
- 표준편차(분산)
- 구간
- 최소값
- 최대값
4. 통계는 분산을 해석하는 방법이다.
- 분산이란 내가 가진 자료(데이터)가 평균값을 중심으로 퍼져 있는 평균적인 거리(면적)
- 표준편차는 분산에 루트를 씌운 값으로 제곱하여 커진 분산의 스케일을 보정하는 의미가 있음
5. 왜 분산과 평균을 사용할까?
- (가우스) 데이터의 불규칙성이 정규분포를 따르면 최소제곱법이 가장 좋은 추정 방법이며, 평균값이 해당 데이터의 가장 좋은 추정값이 됨
- (체비체프) 데이터의 불규칙성이 어떠하든 평균값+-2xSD 범위 안에는 반드시 전체의 4분의 3 이상의 데이터가 존재하는 것이 증명됨