

통계 강의를 듣고 있긴 한데 점점 갈수록 튜터님 말도 빨라지고, 나의 마음도 조급해지고..ㅋ
그나마 이해한 내용 중에 위에 왜도와 이상치 부분이 인상적이었다.
어제로 마친 데이터 분석에서 고소득자와 그 아래 소득층과의 건당 평균 매출액이 큰 차이로 벌어져있었는데, 일단 한가지 목표 및 결론을 세우고 싶어서 세 그룹의 평균 건당 매출액을 계산해서 이를 통해 해결방안을 제시하는 방향으로 나갔었다.
왜도 부분의 c 와 같은 그래프가 되었는데 당연히 고소득자의 평균금액이 훨씬 높으니 전체의 평균치가 덩달아 높아졌고, 그에 따라 저소득층과 중소득층은 평균보다 못미치는 금액이 나올 수 밖에 없는 것이다.
이럴때는 왜도에 해당하는 부분을 떨어트려놓고 분석해야 한다는 사실을 새롭게 알게되었다!
프로젝트 중 담당 튜터님께서 우리 데이터에 아웃라이어 집단이 있을 수도 있는데 이건 나중에 배울테니 일단 알아만 두라고 하셨는데 그게 바로 다다음날에 배우게될 줄이야 ㅎㅎ..
통계라는게 이해하기 매우 어려운 개념이긴 했지만, 데이터의 신뢰성을 주기 위해선 필수로 알아둬야하는 지식이라는걸 알게되었고, 어렵더라도 포기하지 않고 공부해보려고 한다 🧐