Mean vs Median

Hansss·2021년 11월 29일
0

Statistic/Math

목록 보기
10/11

mean

모두 아주 잘 알고 있는 바로 그 평균이다.

전체 데이터를 합하고 전체 데이터 수로 나누면 그것이 평균이다.

장점 : 아무 생각 없이 쓰기 좋다
단점 : outlier가 존재할 시 평균 값이 왜곡 될 가능성이 크다. ex) 대기업 평균 연봉

median

중앙값이라고 하며 정말 단순히 딱 가운데 값을 뽑으면 그것이 중앙값이다.

짝수인 경우 중앙 두 수의 평균을 중앙값으로 삼는다.

장점 : mean에서 단점으로 언급된 outlier의 영향을 거의 안받는다.
단점 : 프로그래밍 적으로 평균보다 복잡하다.

제 생각에는 웬만하면 평균을 쓰고 outlier의 영향을 많이 받는다면 중앙값을 쓰는게 좋을 것 같습니다.

profile
딥러닝 연습생

0개의 댓글