1. 데이터 리터러시란?
- 데이터를 읽고 이해하는 능력
- 데이터를 비판적으로 분석하는 능력
- 결과를 의사소통에 활용할 수 있는 능력
- 데이터 수집과 데이터 원천, 데이터에 대한 활용법 및 데이터를 통한 핵심 지표를 이해하여 올바른 질문을 던질 수 있게 만들어 줌
2. 데이터 분석에 대한 착각
데이터 분석이 잘 진행되지 않으면 파이썬, SQL, Tableau 등 스킬에 대한 지식이 부족해서라고 착각하기 쉬움.
하지만 데이터를 잘 분석한다고 반드시 문제, 목적, 결론이 나오는 것은 아니며, 데이터를 잘 가공한다고 반드시 유용한 정보를 얻을 수 있는 것도 아님.
3. 데이터 해석 오류 사례
심슨의 역설 (Simpson's Paradox)
- '부분'에서 성립한 대소 관계가 그 부분들을 종합한 '전체'에 대해서는 성립하지 않는 모순적인 경우를 의미함
- 전체에 대한 결론이 언제나 개별 집단에 그대로 적용되는 것은 아니며
- 데이터에 기반한 결론이라고 이를 맹목적으로 받아들여서는 안됨
시각화를 활용한 왜곡
- 자료 표현 방법에 따라 해석의 오류 여지가 존재
샘플링 편향 (Sampling Bias)
- 전체를 대표하지 못하는 편향된 표본 선정으로 인해 오류가 발생
상관관계와 인과관계