(출처 : https://www.youtube.com/watch?v=3CC4N4z3GJc)
출처 : https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.GradientBoostingClassifier.html
실제로 캐글에서는 XGboost라는 라이브러리를 사용한 대회 참여나 다양한 시도들이 이루어지고 있습니다. 자매품으로는 Catboost나 조금 더 가벼운 앙상블 모델인 LightGBM이 있습니다.
수많은 featrue를 가진 데이터셋은 최고의 성능을 보장할까요? 정답은 '절대 아님'입니다. [차원의 저주]가 무엇인지 확인하고, 데이터셋의 차원을 축소하는 주요 목적이 무엇인지 서술하세요.
데이터셋에 대해 이야기 할 때, 차원이란 feature와 동의어입니다. 차원 축소의 기법인 PCA 와 LDA에 대해 공부하고, 두 방식의 공통점과 차이점에 대해 서술하세요.