통계 관련 지식은 워낙 방대해서 정말 일부분만 배웠을 뿐이지만, 그마저도 상당히 어려운 학문이라고 생각한다. 그런 어려운 것이 데이터 분석 실무에 맞춰서 꼭 필요한 이론과 내용들만 정리되고, 그 부분만 공부하게 되어서 참 다행이라고 느끼고 있다...
학문적인 의미의 통계는 물론 굉장히 어렵지만, 우리는 이미 일상생활에서 통계를 직감적으로 사용하고 있다. 가령 어떤 물건을 구매할 때, 이전의 물가 상황을 고려해서 구매하려는 상품 중 어떤 브랜드의 상품이 더욱 저렴한지, 정말 사소하게는 아침에 기상할 때 어떤 상태일 때 다리에 쥐가 날 것인지 등을 예로 들 수 있겠다.
오늘 학습한 통계학 기초는 이런 내용을 약간의 계산식을 덧붙여 데이터 분석에 적용할 수 있도록 도와주는 역할을 한다. 이전 기초 프로젝트에서 했던 EDA 과정도 일종의 기술 통계로, 우리는 이미 통계를 활용해서 데이터 분석을 진행해보았다.
통계를 배우는 이유
기술 통계 vs 추론 통계
확률 기초
추론 통계
정규분포와 표준화
👉 즉 통계란, 데이터 분석가가 반드시 알아야 할 통계적 사고의 출발점이고, 나아가 단순 계산이 아닌 결과 해석과 의사결정 활용을 위한 설득적 도구이다.
추정(Estimation)
표본오차와 표준오차(SE)
신뢰구간(Confidence Interval)
가설검정(Hypothesis Testing)
👉 빈도주의 관점에서 모집단을 추정하고, 신뢰구간과 가설검정을 통해 데이터의 의미를 검증하는 방법을 학습했다.
상당히 어려운 내용이었지만, 이미 한 번 적용해 본 것이라면 그렇게까지 겁먹지는 않아도 된다고 생각한다. 결국 앞으로의 분석 과정에서도 필요한 내용이기도 하고.
계산식도 꽤나 복잡하긴 했다만 결국 계산은 컴퓨터가 해주기 때문에, 우리는 통계 코드를 정확하게 짜는 연습을 하면 된다. 뭐, 지금까지와 큰 차이는 없다는 뜻이다. 역시나 오늘의 결론도 "집중해서 열심히 공부하자!"가 되었다.
마치며 : 기다리고 기다리던 주말이다! 팀원 중 한 분이 방어 주문 사이트를 추천해주셔서 바로 방어를 주문했다.
오랜만에 먹는 방어이니만큼, 맛이 좋길 기도하고 있다. 그러면 주말동안의 즐거운 마음으로 다시 다음 주를 활기차게 보낼 수 있을 것 같다. 여러분도 주말동안 맛있는 음식을 마음껏 먹으시길 바란다.