머신러닝은 데이터의 알려진 속성들을 학습하여 예측 모델을 만드는 것데이터를 가장 잘 대변하는 최적의 선을 찾는 과정선형회귀 식($w$: 가중치, b: 편향(Bias))$Y = wX + b$ (머신러닝에서 오차항은 명시적으로 다루지 않음)$X$가 주어졌을 때 선형회귀를
선형회귀 : 숫자, 평균으로 예측로지스틱스 회귀 : 분류(사망/생존)를 예측 \-> 선형회귀를 이용하기 때문에 '회귀'가 붙음Y가 범주(0, 1 사망/생존)인 경우 선형회귀로 표현하기 부적절ex) 성별과 생존, 요금과 생존 등가중치를 안다면 X값이 주어졌을 때 해당
예측모델링 프로세스 앞서 회귀분석은 모델링&평가 부분을 다룸 평가 이전 데이터 전처리와 EDA에 대한 학습을 통해 전체적인 예측모델링 프로세스를 다뤄본다. 데이터 수집 데이터 수집, 적재 : 데이터 엔지니어 이미 존재하는 데이터를 SQL, Python 등으로 추출
분류모델 학습과 실습로지스틱스회귀의사결정나무랜덤포레스트KNN부스팅알고리즘(Grediant, Xboost, Lightgbm)의사결정 규칙을 나무 구조로 나타내어 전체 자료를 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석방법루트 노드(Root Node): 의사결정나무
비지도학습 개념 : 정답을 알려주지 않고 데이터간 유사성으로 정답을 지정하는 것.Kmeans Clustering 군집화RFM으로 고객 세그멘테이션고객 군집화의 방법Recency 구하기불균형 군집화에 대한 로그스케일 적용군집화모델 평가 : 실루엣 스코어지도학습 : 문제(