9/25 1, 2, 3, 세션
A. 강의 소개
한기영 강사님
데이터 엔지니어 10년 / 데이터 분석 및 인공지능 12년
데이터 인사이트 대표
B. 데이터 분석 방법론 (CRISP-DM)
==> 비즈니스 문제 해결 방법론

B-1. 가설 수립
문제를 정의하고, 요인을 파악하기 위해 가설 수립
x = 통화량, 소득 수준, 가입 기간, 성별 등
y = 이탈 여부
B-2. 데이터 이해
B-2-1) 데이터 원본 식별
있을 시 : 그대로 사용 가능한 데이터, 가공해야 하는 데이터
없을 시 : 취득 가능한 데이터, 취득 불가능한 데이터
B-2-2) 데이터 분석 : EDA, CDA
- EDA (Exploratory Data Analysis) : 탐색적 데이터 분석
- CDA (Confirmatory Data Analysis) : 확증적 데이터 분석
B-3. 데이터 준비
개요
- 모든 셀에 값이 있어야 한다
- 모든 값은 숫자여야 한다
- 모든 값의 범위를 일치시켜야 한다 (옵션)
수행되는 내용
- 결측치 조치
- 가변수화
- 스케일링
- 데이터 분할- 데이터 분할
B-4. 모델링
- 데이터로부터 패턴을 찾는 과정
- 오차를 최소화하는 패턴
- 결과물 : 모델 (수학식으로 표현)
B-5. 평가
B-6. 배포