2.2 붓꽃 품종 예측하기 2.3 사이킷런의 기반 프레임워크 익히기 2.4 Model Selection 모듈 소개 2.5 데이터 전처리 2.6 타이타닉 생존자 예측
3.1 정확도(Accuracy) 3.2 오차 행렬 3.3 정밀도와 재현율 3.4 F1 스코어 3.5 ROC 곡선과 AUC 3.6 피마 인디언 당뇨병 예측
4.1 개요 4.2 결정 트리 4.3 앙상블 4.4 랜덤포레스트
4.5 GBM(Gradient Boosting Machine) 4.6 XGBoost(eXtra Gradient Boost) 4.7 LightGBM 4.8 캐글 산탄데르 고객 만족 예측 4.9 캐글 신용카드 사기 검출 4.10 스태킹 앙상블
5.1 회귀 소개 5.2 단순 선형 회귀를 통한 회귀 이해 5.3 경사하강법 5.4 보스턴 주택 가격 예측 5.5 다항 회귀와 과(대)적합/과소적합 이해
5.6 규제 선형 모델 - 릿지, 라쏘, 엘라스틱넷 5.7 로지스틱 회귀 5.8 회귀 트리 5.9 자전거 대여 수요 예측 5.10 캐글 주택 가격: 고급회귀 기법
6.1 차원 축소 개요 6.2 PCA 6.3 LDA 6.4 SVD 6.5 NMF
7.1 K-평균 알고리즘 이해 7.2 군집 평가
7.3 평균 이동 7.4 GMM 7.5 DBSCAN 7.6 고객 세그먼테이션
8.1 텍스트 분석 이해 8.2 텍스트 전처리 - 텍스트 정규화 8.3 BoW 8.4 20 뉴스 그룹 분류 8.5 감성 분석 8.6 토픽 모델링 8.7 문섭 군집화 8.8 문서 유사도 8.9 한글 텍스트 처리 8.10 캐글 Mercari Price Suggestion
9.1 추천 시스템의 개요 및 배경 9.2 콘텐츠 기반 필터링 추천 시스템 9.3 최근접 이웃 협업 필터링 9.4 잠재 요인 협업 필터링