Forbes 2020 향후 10년간 데이터에 대한 보고서를 인용
데이터 처리 속도와 대역폭의 지속적인 증가, 데이터 생성, 공유 및 소비를 위한 새로운 도구의 끊임없는 발명, 새로운 데이터 생성자와 소비자의 꾸준한 추가 데이터가 계속해서 증가함
데이터가 나오는 곳
데이터는 텍스트, 이미지, 비디오, 클릭 스트림, 사용자 대화, 소셜 미디어 플랫폼, 사물 인터넷 또는 IoT 장치, 데이터를 스트리밍하는 실시간 이벤트, 레거시 데이터베이스 및 전문 데이터 제공업체 및 기관에서 제공한 데이터등등 여러가지 원천이 있음
데이터 작업할때 첫번째로 해야하는 일은 원본 소스의 데이터를 복사해 이터 리포지토리로 가져오는 것
- 최종 사용자가 액세스할 수 있도록 구성, 정리 및 최적화
- 조직에서 시행하는 규정 준수 및 표준을 준수
- IoT 장치의 경우 건강, 생체 인식 또는 가정 데이터와 같은 개인 데이터의 저장 및 사용을 규제하는 지침을 준수
비즈니스 이해 관계자는 보고서와 대시보드가 필요함
오늘날은 데이터를 사용하여 기회를 발견하고 해당 지식을 적용하여 차별화하는 조직이 미래를 선도하는 조직임
사기를 탐지하기 위해 금융 거래에서 패턴을 찾든, 전환을 유도하기 위한 추천 엔진 사용, 마이닝, 고객 목소리를 위한 소셜 미디어 게시물 또는 고객 행동 분석을 기반으로 제안을 개인화하는 브랜드이든, 비즈니스 리더는 데이터가 경쟁 우위의 핵심이라는 것을 깨달아야 함
모든 것은 데이터 엔지니어로부터 시작
- 데이터 엔지니어는 데이터 아키텍처를 개발 및 유지 관리하고 비즈니스 운영 및 분석에 사용할 수 있는 데이터를 만드는 사람들
- 데이터 엔지니어는 프로그래밍에 대한 좋은 지식, 시스템 및 기술 아키텍처에 대한 건전한 지식, 관계형 데이터베이스 및 비관계형 데이터 저장소에 대한 심층적인 이해가 있어야
데이터 분석가는 데이터와 숫자를 일반 언어로 변환하여 조직에서 의사 결정을 내리고, 데이터 분석가가 통찰력을 도출하기 위해 데이터를 검사 및 정리하고, 상관 관계를 식별하고, 패턴을 찾고, 통계 방법을 적용할 수 있도록 함
- 데이터를 분석 및 마이닝하고 데이터를 시각화하여 데이터 분석 결과를 해석하고 제시
- 데이터 분석가는 스프레드시트, 쿼리 작성, 차트 및 대시보드 생성을 위한 통계 도구 사용에 대한 충분한 지식이 필요
- 현대의 데이터 분석가도 어느 정도 프로그래밍 기술이 필요
- 강력한 분석 및 스토리텔링 기술이 필요
데이터 과학자는 실행 가능한 통찰력을 위해 데이터를 분석하고 예측 모델을 생성하기 위해 과거 데이터를 학습하는 머신 러닝 또는 딥 러닝 모델을 구축
- 데이터 과학자는 수학, 통계 지식, 프로그래밍 언어, 데이터베이스 및 데이터 모델 구축에 대한 공정한 이해가 필요
- 도메인 지식 필요
비즈니스 분석가는 데이터 분석가와 데이터 과학자와 함께 비즈니스에 미칠 수 있는 영향을 파악하고 액션을 제시함
BI 분석가는 다양한 비즈니스 기능에 대한 데이터를 구성 및 모니터링하고 해당 데이터를 탐색하여 비즈니스 성과를 개선하는 통찰력과 실행 가능한 항목을 추출함으로써 비즈니스 인텔리전스 솔루션을 제공
Based on the goals and outcomes that need to be achieved, there are four primary types of Data Analysis:
Descriptive Analytics, that helps decode “What happened.”
Diagnostic Analytics, that helps us understand “Why it happened.”
Predictive Analytics, that analyzes historical data and trends to suggest “What will happen next.”
Prescriptive Analytics, that prescribes “What should be done next.”
The Data Analysis process involves:
Developing an understanding of the problem and the desired outcome.
Setting a clear metric for evaluating outcomes.
Gathering, cleaning, analyzing, and mining data to interpret results.
Communicating the findings in ways that impact decision-making.