[DevCourse] Day 2 - 데이터 기반 의사 결정

한상우·2023년 11월 21일
0

Data Science Devcourse

목록 보기
2/25
  1. 데이터 기반 의사 결정
  • Data Driven Decision : 의사 결정 과정에서 데이터가 주도적 역할을 하며, 의사 결정이 (거의) 완전하게 데이터에 의해 이끌어진다.

  • Data Informed Decision : 의사 결정 과정에서 데이터를 참고하여 의사 결정을 내린다. 데이터에 근거한다는 점은 위와 같지만, 다른 요인들도 고려하여 의사 결정을 한다.

  • 데이터 기반 의사 결정의 예시 :: 샌프란시스코 지역 전동 스쿠터 공유 서비스 (S사)
    Data : S사에서 확인한 결과 돈을 많이 쓰는 고객들이 몇달 후에는 서비스를 그만 사용하는 현상이 빈번하게 발견됨
    Analysis : 이탈 고객의 사유를 알기 위해 할인 쿠폰을 보내주며 설문조사를 진행. 설문조사 결과 이탈 고객은 회사원들이 많았으며, 이들은 출퇴근길에 전동스쿠터를 사용하는 것에 큰 만족감을 느꼈다고 한다. 그래서 공유 서비스를 사용하는 것이 아니라 직접 전동 스쿠터를 구매하게 되어 자연스럽게 서비스를 그만 사용하게 되었다.
    Decision : 서비스의 타겟을 변경한다. 샌프란시스코에서 생활하는 사람들을 대상으로 하기 보다는, 관광객에 집중하여 서비스한다.

  • 데이터 기반 의사 결정시 주의사항

    • 생존자 편향 (Survivorship Bias) : 생존자 편향은 주로 관찰된 데이터가 성공 혹은 생존한 대상에 중점을 두고 있을 때 발생한다. 이것은 실패한 대상이나 사건이 누락되어 있어서 실제로는 실패가 더 많았을 가능성이 있는 상황에서 나타난다. 예를 들어, 업무 성과에 대한 조사를 진행할 때, 성공한 기업들만을 조사하면 실패한 기업들의 중요한 교훈과 패턴을 놓치게 되는 것이 생존자 편향이다.
    • 확증 편향 (Confirmation Bias) : 확증 편향은 이미 가지고 있는 견해나 신념을 강화하려는 경향이다. 이는 정보를 수집하고 해석할 때 일어나는 편향으로, 자신의 선입견에 부합하는 정보를 주로 찾고 받아들이는 것을 말한다. 이는 객관적이지 않은 판단과 오인을 유발할 수 있다. 예를 들어, 특정 정치적 신념을 가진 사람이 자신의 신념을 지지하는 뉴스만을 선별적으로 찾아보고 읽는 행동이 확인 편향이다.
  1. 데이터 팀의 구조
  • 중앙 집중 구조

    - 모든 데이터 팀원들이 하나의 팀으로 존재하는 구조
    - 일의 우선순위를 중앙 데이터팀이 최종 결정한다
    - 데이터 팀원들간의 지식과 경험의 공유가 쉬워지며, 커리어 경로가 명확하다
    - 현업부서들의 만족도는 상대적으로 떨어진다 (응답속도 느림, 우선순위 결정 X)

  • 분산구조

    - 데이터 팀이 현업 부서별로 존재하는 구조
    - 일의 우선순위를 각 팀별로 결정한다
    - 데이터 팀원들간의 지식과 경험의 공유, 데이터 인프라/데이터의 공유가 어렵다
    - 처음에는 현업부서들의 만족도가 높지만, 보통 데이터 팀원들의 퇴사율이 높아진다

  • 하이브리드 구조

    - 데이터 팀원의 일부는 중앙에서 인프라 작업을 하며 너머지는 현업팀에서 작업하는 구조
    - 중앙 집중 구조와 분산구조의 장점을 모두 갖고 있는 이상적인 구조이다

  1. KPI란?
  • KPI(Key Performance Indicator) : 조직 내에서 달성하고자 하는 중요한 목표이자 가장 중요한 몇가지 지표(Metric)를 의미한다. 보통 정량적인 숫자(매출, 서비스 사용 고객수, ...)로 설정하며 명확하게 정의해야 한다.
  • 좋은 KPI의 기준 : 3A (Accessible, Actionable, Auditable)
    • Accessible : 지표를 보는 것이 쉬워야 한다 (시각화 툴을 사용)
    • Actionable : 실행 가능한 통찰력이 제공되어야 한다. 즉, 지표 등락의 의미가 분명해야 한다.
    • Auditable : (데이터를 기반으로 하며) 지표 계산이 제대로 되었는지 검증이 가능해야 한다

  • 선행 지표(Leading Indicator, 인풋 지표) : 직접 통제 가능한 지표이며, 후행지표에 영향을 주는 지표
    - youtuber를 기준으로 생각하면 다음과 같은 예시가 있다 {업로드 주기, 영상 길이, 영상 광고 수, ...}

  • 후행 지표(Lagging Indicator, 아웃풋 지표) : 선행지표의 결과로, 직접 통제가 불가능한 지표. 보통 해당 지표가 KPI로 선정됨.
    - youtuber를 기준으로 생각하면 다음과 같은 예시가 있다 {영상 조회수, 구독자 수, 좋아요 수, ...}

KPI(후행 지표)를 개선하기 위해서는 통제가 가능한 선행지표에 초점을 맞춰서 출력에 긍정적인 영향을 줘야한다.
이는 아래와 같은 단계로 나누어 볼 수 있다

step 1. KPI에 영향을 주는 input metric이 무엇인지 알아내고, 둘의 관계를 찾아낸다
step 2. 해당 input metric을 조정하여 KPI에 긍정적인 영향을 준다

이러한 단계는 다이어트와 관련된 아래 그림과 같이 표현할 수도 있다.

  1. Tableau와 친해지기 (실습)
  • CSV format으로 주어진 데이터셋을 Tableau Public에 업로드하고, 멀티라인 MAU 차트를 만들어보자 (version : Tableau Public 2023.3)
  1. 파일 업로드
  • 왼쪽 interface에서 적절한 파일의 종류를 선택한다
  1. 요약창 확인
  • 업로드한 파일을 요약한 창이 나온다. 왼쪽 아래 "워크시트로 이동"을 클릭하여 편집창으로 이동하자
  1. MAU 차트 만들기
  • 영상강의를 보며 순조롭게 실습을 완료하였다.
  1. 마무리
  • Tableau를 통해 주변 데이터를 시각화하며 기능을 연습하면 좋을 것 같다.
profile
개인 공부용 블로그입니다

0개의 댓글

관련 채용 정보