[AIVLE SCHOOL] 데이터 분석 (1) - 데이터 분석 방법론

춤추는 머쉬룸·2024년 9월 25일

AIVLE SCHOOL 6기

목록 보기
23/80
post-thumbnail

9/25 1, 2, 3, 세션

A. 강의 소개

한기영 강사님
데이터 엔지니어 10년 / 데이터 분석 및 인공지능 12년
데이터 인사이트 대표

B. 데이터 분석 방법론 (CRISP-DM)

==> 비즈니스 문제 해결 방법론

B-1. 가설 수립

문제를 정의하고, 요인을 파악하기 위해 가설 수립

x = 통화량, 소득 수준, 가입 기간, 성별 등
y = 이탈 여부

B-2. 데이터 이해

B-2-1) 데이터 원본 식별

있을 시 : 그대로 사용 가능한 데이터, 가공해야 하는 데이터
없을 시 : 취득 가능한 데이터, 취득 불가능한 데이터

B-2-2) 데이터 분석 : EDA, CDA

  • EDA (Exploratory Data Analysis) : 탐색적 데이터 분석
  • CDA (Confirmatory Data Analysis) : 확증적 데이터 분석

B-3. 데이터 준비

개요

  • 모든 셀에 값이 있어야 한다
  • 모든 값은 숫자여야 한다
  • 모든 값의 범위를 일치시켜야 한다 (옵션)

수행되는 내용

  • 결측치 조치
  • 가변수화
  • 스케일링
  • 데이터 분할- 데이터 분할

B-4. 모델링

  • 데이터로부터 패턴을 찾는 과정
  • 오차를 최소화하는 패턴
  • 결과물 : 모델 (수학식으로 표현)

B-5. 평가

B-6. 배포

0개의 댓글