14주차 일정
-
금
- 강승일 강사님
- 태블로 : Self Service Visual Dahsboard
-
월
- 박조은 강사님 : 머신러닝 성능개선
- RandomSearchCV, casual, registered 활용하기
- 수백 수천개의 피처를 다루는 방법
- XGBoost
-
화
- 박조은 강사님 : 머신러닝 성능개선
- XGBoost, LightGBM
- 수백 수천개의 피처를 다루는 방법 => 기술통계, 유일 값 빈도수, 왜도, 첨도, 평균, 편차 등
- 수
- 박조은 강사님 : 머신러닝 성능개선
- XGBoost, LightGBM, CatBoost
- 분류의 측정 기법(Accuracy, Precision, Recall, F1-score 등)
- 불균형 데이터와 SMOTE
학습 내용
📝20230320 박조은 강사님 - 수업 필기
📝20230321 박조은 강사님 - 수업 필기
📝20230322 박조은 강사님 - 수업 필기
왜 정규분포 형태가 모델 학습에 도움이 되는지
정규화 하는 이유?
A: 나 수능 영어 100점 받았어! (100점 만점)
B: 나 토익 100점 받았어! (990점 만점)
특성들의 단위를 무시하고 값으로 단순 비교할 수 있게 만들어 줄 필요가 있다.
scale의 범위가 너무 크면 노이즈 데이터가 생성되거나 overfitting이 될 가능성이 높아지기 때문이다.
소감
한번 놓치니까 이렇게 하기싫을 수 없다.
이제는 그냥 놓치더라도 그 날 수업을 따라가려고 노력해봐야겠다.
안녕하세요. 멋쟁이사자처럼 AI 스쿨 다음 기수를 신청하였는데, 선배님께 몇 가지 여쭤봐도 괜찮을까요?