[인프런] 데이터 리터러시 2

타키탸키·2022년 7월 20일
0

데이터 기획

  • 의사결정을 위한 BQ 설정
    • 분석 목적(BQ) 정하기
      • 의사 결정하려는 주제(BQ)가 무엇인가?
      • 현재 업무에서 궁금한 것은?
      • 당면한 의사결정 사항은?
  • 데이터 분석 모델
    • 결정론적이고 예측 가능한 성분인 수학 공식
    • 관측값 = 결정론적 모형 + 잔차 오차(현실)
    • 오차 != 실수
      • 오차 = 분석 모델이 관측한 것을 100% 정확하게 표현할 수 없음
    • 잔차 오차가 적은 모델일수록 좋은 모델
    • 분석 모델이 다르면 분석 결과에도 차이가 나타난다
  • 데이터 분석에서 선호되는 분석 모델 수립 전략(모형화)
    • 비교적 단순한 수학적 표현
      • 선형 회귀 분석
      • 변수 간 연관성
      • 통계학자들이 선호
    • 복잡한 결정론적 모형
      • 일기예보
      • 물리적 과정의 과학적 이해에 기초
      • 근원적 메커니즘을 나타낼 목적
      • 응용 수학자들이 개발
    • 과거 사례들의 분석을 통해 결정을 내리거나 예측하는 알고리즘
      • 책 추천 알고리즘
      • 기계학습을 거쳐 나온 알고리즘
      • 블랙박스 모형(내부 작동 과정 알 수 없음)
  • 데이터 분석 모델을 만드는 과정
    • 분해 >> 패턴 인식 >> 추상화(핵심 정보 요약) >> 알고리즘화
  • BSC(Balanced Score Card)
    • 분석 목표 KPI 도출 프레임워크
    • 재무
      • 매출 증대
      • 이익 극대화
      • 자본 관리 및 투자
    • 고객
      • 신규 고객 관리
      • 시장 점유율 확보
      • 우수 고객 / 일반 고객 / 휴면 고객 관리
    • 회사 내부 역량
      • 신규 서비스
      • ex:) 롯데(오프라인) vs. 네이버(온라인)
    • 직원
      • 직원 관리
      • 업무 환경 및 복리 후생
      • 신입사원 업무 교육
      • 팀/개인 KPI제(인당 매출액)

데이터 전처리

  • 데이터 처리 역량
    • 데이터를 분석 가능한 형태로 전환하는 능력
      • 테이블 형태
    • 신규 데이터가 주기적으로 입력되어 자동 변환되도록 업데이트 하는 능력
    • 형태가 다른 데이터 세트에서 추출, 필터링 등을 통해 하나의 데이터 세트로 통합하는 능력
  • 테이블
    • 분석에 용이한 형태
    • 하나의 헤더
    • 위에서 아래로 입력

데이터 분석

  • 데이터 분석 역량
    • 데이터를 분석 목적에 맞게 요약하여 특징을 파악하는 능력
    • 여러 수준의 분석을 거쳐 분석 목표 설계
      • 복잡한 통계 처리와 추정
    • 정량적, 정성적으로 분석된 결과를 해석하여 설득력 있는 보고서를 작성하는 능력
  • 데이터 분석 유형
    • 데이터를 기반으로 '사람이' 똑똑해지도록 하는 분석
      • 목표: 의사 결정
    • 데이터를 기반으로 '기계가' 똑똑해지도록 하는 분석
      • 목표: data product
      • 지도/비지도, DL, ...
  • 데이터 분석 종합 역량
    • 분석 도구, 매뉴얼 활용 역량
    • 통계 지식
    • 분석 모델
    • 비즈니스 도메인 지식 & 경험
  • 데이터 사이언스 프로세스
    • 현실 세계 >> 데이터 수집 >> 데이터 전처리 >> 마스터 데이터셋 >> EDA >> 데이터 분석 도구 >> 분석 모델 및 알고리즘 적용 >> 시각화 보고서 >> 비즈니스 의사 결정 / 데이터 프로덕트
  • 데이터 분석 실무 프로세스
    • 분석 목표 정하기
    • 데이터 수집 및 정제
    • 데이터 탐색(EDA)
    • 분석 결과 시각화 및 공유
    • 결과를 기반으로 의미 도출
profile
There's Only One Thing To Do: Learn All We Can

0개의 댓글