학습목표
데이터 분석가가 되려면 어떤 역량을 길러야 하는지 알아보자!
이 아티클에서는 필요한 역량을 하드스킬 5개, 소프트스킬 4개로 정리하였다.
하드스킬을 다시 3종류로 나눠봤고 대충 중요한 것만 적어봤다
1-1. 데이터를 처리하는 언어
당연하게도 데이터를 처리하기 위한 언어들을 사용할 줄 알아야 한다.
보통은 SQL, 파이썬이고 일부는 엑셀을 사용하기도 한다.
1-2. 기타 여러가지 툴
SaaS(Software as a Service)나 BI 같은 툴도 활용할 줄 알아야 한다
이게 있으면 데이터 기반의 의사결정을 빠르게 할 수 있다!
그리고 툴과 더불어 데이터 마트를 직접 설계하고 자동화하는 방법까지
SaaS의 에로는 구글 드라이브, 슬랙, 노션 등이 있다
(전부 지금 쓰고 있는 거!!)
데이터 마트?
분석하기 쉽게 정리해 놓은 ‘주제별 데이터 저장소’
특정 팀/목적에 맞게 가공된 작은 저장소
데이터 웨어하우스(DWH)?
회사 전체 저장소
.
2-1. 통계학
EDA 단계와 연관성 큼 - 상관관계, 회귀분석, 인과관계
통계학에는 기술 통계, 추론 통계이 있음
기초 통계학 - 가설검정 - A/B 테스트 - 귀무가설, 대립가설, 검정력
가설검정?
내가 생각한 게 진짜로 맞는지, 우연이 아닌지”를 통계적으로 판단하는 절차
A/B 테스트?
두 가지 버전(A와 B)을 고객에게 나누어 보여주고, 어떤 게 더 좋은 성과를 내는지 비교하는 실험
2-2. 도메인 지식
도메인에 따라 문제와 액션도 달라짐
이 부분이 좀 낯설었다...!
업무 자동화
일회성 분석의 경우에는 BI, 대시보드, 데이터 플랫폼 등을 활용해서 자동화로 해결이 가능하다~ => 업무 효율 상승한다~
데이터 엔지니어링이란?
데이터 마트, 데이터 파이프라인을 만드는 것!
데이터를 수집 → 정제 → 저장하는 과정 전부를 만드는 기술로,
기초공사를 하는 역할이라고 생각하면 될 듯
효과적인 데이터 엔지니어링 X --> 데이터 구도의 복잡성 관리가 어려움 --> 기회 손실과 비효율성이 발생할 수 있음ㅠㅜ
요새는 데이터 분석가에게도 엔지니어링 언어&툴 활용 능력도 중요해지는 추세
예) airflow,SQL, ....
.
데이터를 다양한 직무의 관점에서 바라보고, 모두가 이해할 수 있도록 설명해야 함!
업무 특성 상 다양한 직무와 협업을 하게 됨
-> 다른 직무 사람들이 잘 이해할 수 있도록 말하기
데이터 분석 프로세스는 아래와 같이 진행됨
정의>가설수립>데이터분석>문제해결
그래서 첫 단계인 문제 정의도 꽤나 중요한 단계다~
-> 문제를 논리적으로 정의, 현상에 대한 파악을 토대로 다양한 분석 방법론을 시도하는 것이 중요하다~
누구나 이해할 수 있게 작성하는 것이 중요
분석 결과를 바탕으로 액션 아이템까지 구상할 수 있어야 함
보고서를 비지니스 관점에서 작성하기
.
실무 사례를 어떤 걸 찾아야 할까 고민을 많이 해보다가, 계속해서 강조하던 시각화! 보고서! 소통!에 대해 좀 더 잘 이해해보고자 잘 쓴 보고서 예시에 대해서 살펴봤고, 어떻게 해야 잘 쓸 수 있는지 알아보았다!

일단 사진들을 보자면 공통적으로 페이지가 꽉 차있다.
그리고 한페이지 내에서도 이미지가 다양하다
왜 그럴까 살짝 생각해봤는데, KPI(핵심성과지표)의 각 요소마다 나타내기 적합한 그래프가 달라서 이미지가 다양한 것 같고, 페이지를 꽉꽉 채운 건 크게 볼 수록 눈에 잘 들어와서 그런 걸까.....?
+) 위에 티라노가 제법 귀엽다.
.
분석 보고서에 대한 이해: 탬플릿 및 샘플
데이터 분석 리포트 작성방법
위 링크들에서는 분석 보고서 작성 프로세스 뿐만 아니라
효과적인 레이아웃 구성, 논리구조 등에 대해서도 설명해주고 있다.
보고서를 작성하기 전 한번 더 슥- 훑어보면 좋을 듯 하다~
데이터 분석가가 되려면 도메인 지식이랑 분석 툴을 다루는 것 뿐만 아니라,
좋은 소통을 위한 시각화 툴도 다룰 줄 알아야 하고,
좋은 분석을 위해서 통계적 지식과 문제 정의에 대한 통찰력이 필요하다는 것을 알 수 있었다.
캠프를 진행하면서 내가 이 부분들이 계속 발전하고 있는지
주기적으로 점검시간을 갖 것도 좋을 것 같다~