선정 아티클
데이터 리터러시(Data Literacy)를 올리는 방법
그 데이터는 잘못 해석되었습니다
요약
[주제]
아티클의 주제 및 목차를 요약해주세요.
- 데이터 리터러시(Data Literacy)를 올리는 방법
- 데이터 리터러시란?
- 데이터/실험 기반 사고방식 만들기
- 분석 흐름대로 데이터를 탐색할 수 있는 환경
- 데이터 분석가의 역할
- 그 데이터는 잘못해석되었습니다
- 데이터를 잘못 해석하는 유형
- 데이터를 제대로 해석할 수 있는 방법
[아티클 요약]
아티클의 전체 내용을 요약해주세요. 단순 내용을 따라적는 것이 아닌 중학생도 쉽게 이해할 수 있게 나만의 언어로 요약해주세요.
-
데이터 리터러시(Data Literacy)
- 데이터를 활용해 문제를 해결할 수 있는 능력
- 어떤 데이터를 보고 어떤 의사결정을 내리는가에 따라 데이터 활용 역량 확인 가능
- 해결하려는 문제나 실제 실행과 "관련 있는" 데이터를 고를 수 있어야 함
- 데이터를 잘 활용한다 = 데이터를 활용해 문제를 잘 정의하고 해결할 수 있다.
-
데이터/실험 기반 사고방식
- 실험 프로세스/실험 보드: 업무가 데이터와 실험 기반으로 이루어지도록 만든다.
- 데이터 중심으로 문제를 더 잘 해결하도록 실험을 하듯 업무 진행하기
-
분석 흐름대로 데이터를 탐색할 수 있는 환경
- 데이터맵(관계도): 각 지표 간의 관계를 쉽게 이해할 수 있도록 만들어 문제가 어떤 지표와 연관되어 있는지 빠르게 파악
1) 측정 가능한 인풋 지표
2) 직접적으로 control 가능한 인풋 지표
- 대시보드 (참고)
- 지표 관계 분석 흐름을 따라가며 지표를 탐색하고 현재 수준을 확인
-
데이터 분석가의 역할
- 분석가의 역할이 단순히 데이터를 추출하고 분석 내용을 리포팅하는 것에서 그쳐서는 안 됨
- 문제를 정의하고 원인을 분석한 뒤 액션 아이템까지 도출해 리포트를 제공받은 팀이 실행에 옮기도록 만들어야 함
- OKR(Objectives and Key Results) 설정하고 업무 방향성 일치시키기
- 데이터 플랫폼
- 데이터 레이크: 모든 원천 데이터 적재
- 데이터 웨어하우스: 신속, 정확한 데이터 추출 구조화
- 데이터 카탈로그: 어떤 데이터가 있는지 쉽게 확인
-
데이터를 잘못 해석하는 상황별 유형
- 생존자 편향의 오류
- 무사 귀환한 전투기를 대상으로 총탄 자국을 확인하다 보니 발생한 인지적 오류
- 총탄 자국이 많은 곳이 아니라 적은 곳을 강화해야 함 → 무사 귀환한 전투기는 그 부위에 총탄을 맞고도 귀환했을 만큼 크게 영향이 없었다는 것이기 때문
- 생존자 편향의 오류를 막기 위해서는 전체 대상을 기준으로 잡는 것이 중요
- 심슨의 역설(Simpson's paradox)
- 전체 지표와 그룹을 나눈 지표의 방향성이 다르게 나타나는 상황
- 심슨의 역설을 방지하기 위해서는 전체 집단의 지표뿐만 아니라 '집단을 나누어' 지표를 확인하는 과정이 필요
→ 지나치게 작게 나누면 복잡도가 높아져 해석하기 어려워지므로 특성이 다를 수 있다고 여겨지는 기준(성별, 연령대, 기기 타입, 신규/기존 등)으로 지표를 살펴보는 것이 효과적
- 상관관계를 통한 성급한 일반화
- 상관성은 있으나 인과성이 없는 경우 → 제 3의 공통 원인이 존재할 가능성 높음
- 상관관계를 통한 성급한 일반화의 함정에 빠지지 않기 위해 사용자의 행동과 심리를 인지적으로 구조화하고 두 지표에 동시에 영향을 줄 공통 원인이 있는지 살펴야 함
- 새로운 구조로 지표 간의 관계 파악하는 과정 꼭 넣기
→ 비슷해 보이는 패턴이 있어도 쉽게 일반화하고 연결하지 말 것
- 목표에 맞지 않는 지표 선택
- 정확히 어떤 관점에서 개선할지 목적에 맞는 지표를 선택하고 목적을 명확히 해야 제대로 된 의사결정 가능
-
세이건 표준 참고하기
- 데이터는 가공하는 기준과 방법에 바뀔 수 있고, 데이터를 해석하는 사람의 생각이 반영될 수 있어 데이터가 잘못 해석된다면 잘못된 방향으로 이어질 수 있음
- 칼 세이건의 세이건 표준(Sagan standard)
- 데이터를 잘못 해석하기 위해 참고하면 좋음
"특별한 주장에는 특별한 근거가 필요하다."
(Extraordinary Claims Require Extraordinary Evidence, ECREE)
- 데이터를 특별한 주장으로 연결시키기 전 충분한 근거를 확보했는지, 데이터를 잘못 해석했을 가능성은 없는지 인지적으로 노력하는 과정이 필요함
인사이트
해당 아티클을 읽고 새롭게 알게 된 것, 앞으로 나의 방향성에 대한 회고가 있다면 적어주세요. 인사이트가 가장 중요합니다.
- 데이터 분석 → 확률과 통계 기반 → 표본과 모집단에 따라 바뀔 수 있음
- 따라서 분석 전 먼저 데이터 검증, 가설 검정 확실하게 해야 함