- 문해력
- 데이터를 읽고 쓸 줄 아는 능력
- 읽고 쓰고 > 이해> 소통, 창조
- 왜곡된 데이터가 만들어낸 가짜를 구분할 수 있는 기본 능력
- 데이터 읽기> 데이터 작업하기 > 데이터로 소통하기
- 기획 : 문제해결을 위한 가설 설정
- 현재 문제가 무엇인가?
- 내가 세운 가설이 적절한가?
- 가설을 세분화 한다- 수집 :
- 어떤 데이터가 필요한가?
- 수집할 수 있는 데이터 인가?
- 데이터 수집을 위해 무엇이 필요한가?
- 육하원칙하의 데이터 수집- 이해 및 관리
- 내가 수집한 데이터의 출처가 깨끗하고 사용가능한 것인가?
- 데이터에 오류, 변수가 얼마나 포함되어 있고 추가되지 않은 데이터는 없는가?
- 데이터의 양이 방대하다면 효율적인 관리를 위해 팀원을 확보해야하는가?- 분석
- 현재 데이터셋이 내가 하고자 하는 작업에 적합한가?
- 데이터셋을 통해 무엇을 알아낼 수 있는가?
- 데이터를 분석한 결과가 유의미한 것인가?
- 내가 세운 가설이 검증 될 수 있는가?- 시각화
- 데이터를 통해 찾아낸 의미를 어떻게 전달 할 것인가?
- 누구에게 어떤 방법으로 전달할 것인가?
- 데이터를 모르는 사람도 한 눈에 의미를 알 수 있는가?
- 제작된 결과물이 편향되지는 않았는가?
- Visual Vocabulary : 시각화의 룰을 정제해 정리해놓은 사이트(https://ft-interactive.github.io/visual-vocabulary/)
Amazon : prime now
- 구매하지 않고 장바구니에만 상품을 넣어도 고객의 기존 구매이력 데이터를 기반으로 구매할지 아닐지를 예측하여 배송을 시작한다
- 아마존 배송 경로 : 물류에 대한 순환이 빨라지기 때문에 고정 배송 지출비를 줄일 수 있다
테슬라 : 원래 마케팅, 홍보 부서가 없었다
- 자율주행이 가능한 차를 출차하고 소프트웨어를 통해 사용여부를 설정하는 형태
- 소프트웨어의 자동 업데이트
나이키 : 월스트리트 옆 소호 스트리트에 큰 오프라인매장을 짓고 다양한 스포츠를 체험하고 제품을 활용해 볼 수 있도록 함
- 제품 커스터 마이징 가능, 다양한 고객 니즈 데이터를 정확하고 빠르게 수집할 수 있다
자라 : 다품종 소량생산
- MIT 연구팀과 연계해 빅데이터를 활용하는 재고관리 시스템을 개발함
- 영업 이익률 57% 상승 기록
- RFID를 활용하여 트렌드를 수집