[statistics] 통계적 의사결정

박경국·2022년 4월 20일
0

Statistics

목록 보기
7/16
post-thumbnail

*Sapientia a Dei님의 유튜브를 참고하여 정리했습니다.

오늘은 A/B 테스트 프로젝트 진행 첫 날입니다.
프로젝트 진행을 위해 필요한 개념들을 다시 정리합니다.

TIL

  • 결정론적 의사결정
  • 통계적 의사결정
  • 평균과 표준편차

1. 결정론적 의사결정

  • 결정론적 의사결정과 대비되는 의사결정 방법
  • 결정론적 의사결정은 변화의 원인을 결정론적으로 확신하는 의사결정을 의미한다.
  • 예를 들어, 매출이 1,000만원이 오르면 새로운 판매전략이 그 원인이라고 생각하는 것이 결정론적 의사결정이다.
  • 또는, 수학점수가 오른 이유를 학원을 다녔기 때문으로 확신하는 것을 결정론적 의사결정이라고 한다.

2. 통계적 의사결정

  • 어떤 사건이 우연히 발생할 확률을 묻는 것으로 시작하는 것을 말한다.
  • 만약 어떤 사건이 우연히 발생할 확률이 극히 낮다면, 해당 사건이 어떤 요인의 영향을 받았다고 가정할 수 있는 것이다.
  • 판매전략의 변화로 매출이 우연히 1,000만원 오를 가능성은 얼마일지, 학원을 다녀서 수학점수가 우연히 10점 오를 가능성은 얼마일지 묻는 것이 통계적 사고이다.

3. 데이터를 설명하는 대표적인 특징들(대표값)

  • 평균
  • 중간값
  • 최빈값
  • 표준편차(분산)
  • 구간
  • 최소값
  • 최대값

4. 통계는 분산을 해석하는 방법이다.

  • 분산이란 내가 가진 자료(데이터)가 평균값을 중심으로 퍼져 있는 평균적인 거리(면적)
  • 표준편차는 분산에 루트를 씌운 값으로 제곱하여 커진 분산의 스케일을 보정하는 의미가 있음

5. 왜 분산과 평균을 사용할까?

  • (가우스) 데이터의 불규칙성이 정규분포를 따르면 최소제곱법이 가장 좋은 추정 방법이며, 평균값이 해당 데이터의 가장 좋은 추정값이 됨
  • (체비체프) 데이터의 불규칙성이 어떠하든 평균값+-2xSD 범위 안에는 반드시 전체의 4분의 3 이상의 데이터가 존재하는 것이 증명됨

0개의 댓글