[240827] 아티클 스터디 3

Suhyeon Lee·2024년 8월 27일
0

선정 아티클

데이터 리터러시(Data Literacy)를 올리는 방법
그 데이터는 잘못 해석되었습니다

요약

[주제]

아티클의 주제 및 목차를 요약해주세요.

  • 데이터 리터러시(Data Literacy)를 올리는 방법
    • 데이터 리터러시란?
    • 데이터/실험 기반 사고방식 만들기
    • 분석 흐름대로 데이터를 탐색할 수 있는 환경
    • 데이터 분석가의 역할
  • 그 데이터는 잘못해석되었습니다
    • 데이터를 잘못 해석하는 유형
    • 데이터를 제대로 해석할 수 있는 방법

[아티클 요약]
아티클의 전체 내용을 요약해주세요. 단순 내용을 따라적는 것이 아닌 중학생도 쉽게 이해할 수 있게 나만의 언어로 요약해주세요.

  • 데이터 리터러시(Data Literacy)

    • 데이터를 활용해 문제를 해결할 수 있는 능력
    • 어떤 데이터를 보고 어떤 의사결정을 내리는가에 따라 데이터 활용 역량 확인 가능
    • 해결하려는 문제나 실제 실행과 "관련 있는" 데이터를 고를 수 있어야 함
      • 문제 정의 → 솔루션 → 측정 지표
    • 데이터를 잘 활용한다 = 데이터를 활용해 문제를 잘 정의하고 해결할 수 있다.
  • 데이터/실험 기반 사고방식

    • 실험 프로세스/실험 보드: 업무가 데이터와 실험 기반으로 이루어지도록 만든다.
    • 데이터 중심으로 문제를 더 잘 해결하도록 실험을 하듯 업무 진행하기
  • 분석 흐름대로 데이터를 탐색할 수 있는 환경

    • 데이터맵(관계도): 각 지표 간의 관계를 쉽게 이해할 수 있도록 만들어 문제가 어떤 지표와 연관되어 있는지 빠르게 파악
      1) 측정 가능한 인풋 지표
      2) 직접적으로 control 가능한 인풋 지표
    • 대시보드 (참고)
      • 지표 관계 분석 흐름을 따라가며 지표를 탐색하고 현재 수준을 확인
  • 데이터 분석가의 역할

    • 분석가의 역할이 단순히 데이터를 추출하고 분석 내용을 리포팅하는 것에서 그쳐서는 안 됨
    • 문제를 정의하고 원인을 분석한 뒤 액션 아이템까지 도출해 리포트를 제공받은 팀이 실행에 옮기도록 만들어야 함
    • OKR(Objectives and Key Results) 설정하고 업무 방향성 일치시키기
    • 데이터 플랫폼
      • 데이터 레이크: 모든 원천 데이터 적재
      • 데이터 웨어하우스: 신속, 정확한 데이터 추출 구조화
      • 데이터 카탈로그: 어떤 데이터가 있는지 쉽게 확인
  • 데이터를 잘못 해석하는 상황별 유형

    • 생존자 편향의 오류
      • 무사 귀환한 전투기를 대상으로 총탄 자국을 확인하다 보니 발생한 인지적 오류
      • 총탄 자국이 많은 곳이 아니라 적은 곳을 강화해야 함 → 무사 귀환한 전투기는 그 부위에 총탄을 맞고도 귀환했을 만큼 크게 영향이 없었다는 것이기 때문
      • 생존자 편향의 오류를 막기 위해서는 전체 대상을 기준으로 잡는 것이 중요
    • 심슨의 역설(Simpson's paradox)
      • 전체 지표와 그룹을 나눈 지표의 방향성이 다르게 나타나는 상황
      • 심슨의 역설을 방지하기 위해서는 전체 집단의 지표뿐만 아니라 '집단을 나누어' 지표를 확인하는 과정이 필요
        → 지나치게 작게 나누면 복잡도가 높아져 해석하기 어려워지므로 특성이 다를 수 있다고 여겨지는 기준(성별, 연령대, 기기 타입, 신규/기존 등)으로 지표를 살펴보는 것이 효과적
    • 상관관계를 통한 성급한 일반화
      • 상관성은 있으나 인과성이 없는 경우 → 제 3의 공통 원인이 존재할 가능성 높음
      • 상관관계를 통한 성급한 일반화의 함정에 빠지지 않기 위해 사용자의 행동과 심리를 인지적으로 구조화하고 두 지표에 동시에 영향을 줄 공통 원인이 있는지 살펴야 함
      • 새로운 구조로 지표 간의 관계 파악하는 과정 꼭 넣기
        → 비슷해 보이는 패턴이 있어도 쉽게 일반화하고 연결하지 말 것
    • 목표에 맞지 않는 지표 선택
      • 정확히 어떤 관점에서 개선할지 목적에 맞는 지표를 선택하고 목적을 명확히 해야 제대로 된 의사결정 가능
  • 세이건 표준 참고하기

    • 데이터는 가공하는 기준과 방법에 바뀔 수 있고, 데이터를 해석하는 사람의 생각이 반영될 수 있어 데이터가 잘못 해석된다면 잘못된 방향으로 이어질 수 있음
    • 칼 세이건의 세이건 표준(Sagan standard)
      • 데이터를 잘못 해석하기 위해 참고하면 좋음

        "특별한 주장에는 특별한 근거가 필요하다."
        (Extraordinary Claims Require Extraordinary Evidence, ECREE)

      • 데이터를 특별한 주장으로 연결시키기 전 충분한 근거를 확보했는지, 데이터를 잘못 해석했을 가능성은 없는지 인지적으로 노력하는 과정이 필요함

인사이트

해당 아티클을 읽고 새롭게 알게 된 것, 앞으로 나의 방향성에 대한 회고가 있다면 적어주세요. 인사이트가 가장 중요합니다.

  • 데이터 분석 → 확률과 통계 기반 → 표본과 모집단에 따라 바뀔 수 있음
  • 따라서 분석 전 먼저 데이터 검증, 가설 검정 확실하게 해야 함
profile
2 B R 0 2 B

0개의 댓글