[그룹스터디] [2주차] 데이터 직군 세분화 하기

·2023년 3월 26일
0

[그룹스터디]

목록 보기
2/4
post-thumbnail

💡스터디 주제

1. Data Analyst, Data Engineer, Data Scientist 직군 세분화 하기

  • Data Analyst, Data Engineer, Data Scientist 각 직군이 어떤 일을 하는지, 차이점 파악
  • 희망하는 직군을 선택 후 이유 서술

💡데이터 직군 세분화

💻 데이터 분석

  • 데이터 분석가 - 리포팅, 인사이트 추출, 지표관리
  • 데이터 사이언티스트 - 데이터 사이언스 지식 활용하여 협업 문제 해결
  • 데이터 엔지니어 - 데이터 적재 및 운용 인프라 구축

💻 데이터 활용

  • 비즈니스 분석가
  • 퍼포먼스 마케터
  • CRM 마케터
  • 그로스 해커

💡데이터 분석 직군 세분화

💻 데이터 분석가(애널리스트)

  • 데이터 분석 처리 및 비즈니스에 유의미한 결과 창출
  • 분석 도구를 활용해서 데이터 보고서 설계 및 작성

💻 데이터 사이언티스트

  • 과거 패턴으로부터 미래 예측
  • 비즈니스에 여러 알고리즘 적용시켜 새로운 분석 모델 및 머신러닝 모델 수정/개발

💻 데이터 엔지니어

  • 데이터 웨어하우스, 데이터베이스 구축 및 관리
  • 데이터 파이프라인 구축
  • SQL 튜닝
  • 대용량/실시간 시스템 개발 (Hadoop, Spark)
  • 분석가/사이언티스트 지원 업무

💡실무에서 각 직무의 역할과 업무

데이터 분석가, 사이언티스트, 엔지니어 비교 정리 - 곰사원은 곰대표

설명 예제 : 음식 배달 서비스에서의 데이터 분석

  • 음식 배달 서비스에서 사용자들의 주문건수를 늘리기 위해서 배달비 무료 쿠폰을 제공하는 프로모션 준비
  • 이때 재방문 주기가 지났는데도 앱에 접속하지 않은 고객들에게만 쿠폰 발송
  • 또한 고객들의 특징별로 맞춤형 프로모션을 전개하기 위해서 평소 배달료를 신경 쓰지않는 고객들과 배달비 무료 쿠폰이 있을때만 주문하는 고객 구분하려한다.

❓이때 데이터 분석가가 할 수 있는 질문

  1. 어떻게 고객들의 재방문 주기를 계산할 것인가?
  2. 어떻게 배달비 무료 쿠폰이 있을 때만 주문하는 고객을 분류해낼까?
  3. 회사 전체 이익에 도움이 될까? 혹시 손해가 나지 않을까?

🔎 데이터 분석가

프로모션을 시행 했을때 비즈니스적으로 효과가 있을지 종합적으로 사전에 검토하거나 이미 프로모션을 시작한 경우라면 어떤 효과를 봤는지 모니터링하고 분석하여 시각화한 후에 보고서로 만드는 작업을 한다 .
우선적으로 타겟팅 해야하는 고객군을 선정해서 의사결정권자들에게 보고를 하기도 한다.
예를들어 평소에도 비싼 배달비를 감수하면서 배달을 하는 고객들은 배달비 무료 프로모션에서 제외하거나 평균적으로 저렴한 음식만 구매하는 고객들은 배달비 무료쿠폰을 사용할 경우 매출은 증가하더라도 영업이익이 마이너스가 되므로 프로모션 대상에서 제외해야 한다는 마케팅 제안한다.

❗ 필요한 스킬

  • 해당 비즈니스 전반에 대한 도메인 지식
    도메인을 제대로 알아야 어떤 문제가 있는지 파악하고 데이터를 분석해서 개선안을 만들 수 있다.

  • 데이터 시각화 능력과 커뮤니케이션 능력
    의사결정권자 앞에서 분석된 데이터를 보고하고 설득해야 하기 때문에 power BI, Tableau, Google Analytics와 같은 시각화 툴을 사용할 수 있어야한다. 또한 프로그래밍 능력이 필수로 요구되지 않으나 데이터를 가공하고 분석하는 과정에서 SQL, Python, R 기초적인 수준 필요한다.

🔎 데이터 사이언티스트

다양한 빅데이터를 인공지능에 학습시켜 딥러닝 모델을 개발한다.
수집된 데이터를 갖고 머신러닝이나 딥러닝을 통해서 고객별 재구매 주기를 계산하는 로직을 개발하여 다음 재구매일을 예측하는 모델을 만들어 인공지능이 고객 행동 패턴을 학습하게 한다.
예를들어 예측 결과 20일마다 주문을 하는 고객이 20일이 지나도 재주문을 하지 않는다면 고객에게 쿠폰을 발급한다.

❗ 필요한 스킬

  • 해당 비즈니스 전반에 대한 도메인 지식
    도메인을 제대로 알아야 어떤 문제가 있는지 파악하고 데이터를 분석해서 예측 모델을 개발한다

  • 모델을 개발하기 위한 수학, 통계, 프로그래밍 능력
    python, scala 프로그래밍 언어와 딥러닝 모델을 다루는 pytorch, tensorflow와 같은 라이브러리들도 능숙하게 다뤄야 하며 데이터를 읽을 수 있어야 하므로 hadoop이나 Spark에 대한 지식이 플러스 요인으로 작용한다.

🔎 데이터 엔지니어

어플을 사용하는 고객들의 데이터를 수집하고 저장하는 일을 한다.
고객들의 앱 사용 로그를 수집하고 데이터베이스라는 저장공간에 효율적으로 저장한다.
엔지니어들은 정리되지 않은 고객 로그 데이터들을 유의미하게 분석하고 이용할 수 있도록 데이터 전처리 과정을 거쳐 하둡과 같은 빅데이터 시스템에 저장하는 업무를 한다.

❗ 필요한 스킬

  • 데이터 파이프라인을 구축하고 성능을 최적화하는 능력
    프로그래밍 지식 외에도 데이터 웨어하우스, hadoop, Spark 같은 빅데이터 플랫폼 관련 업무 경험과 지식이 필요하다.

💡희망하는 직군 선택

💻 데이터 사이언티스트

  • 데이터를 분석하여 유의미한 예측 모델을 만드는 일을 하는 데이터 사이언티스트 직무를 희망한다.
  • 다양한 고객 데이터를 인공지능에 학습시켜 양질의 정보를 고객에게 제공하여 고객이 최적의 의사결정을 할 수 있도록 돕고싶다.
profile
개발하고싶은사람

0개의 댓글