# XGBoost
XGBOOST 분석
Loss function Bagging의 기본적인 loss 식으로써 이전 time series (t-1)에서의 예측값에 현재 분류기의 예측 function을 더한 형태에 regularization 항을 더함 이 식을 2차 테일러 전개식을 이용한 유클리디안 공간으로의

머신러닝 모델_XGBoost_LightGBM
두 모델에 대해 알기 전에 먼저 GBM이란?GBM(Gradient Boost Machine), 앙상블 머신러닝 기법 중의 하나로 부스팅 기법을 사용한다. 경사 하강법(Gradient Descent)를 이용해 가중치를 업데이트 해 label값과 가까워질 때까지 여러 모델

XGBoost
앙상블 학습이란, 강한 하나의 모델 대신 약한 모델을 여러 개 사용하여 정확성을 높이는 머신러닝 기법임 간단한 예시로 한명의 전문가보다 여러명의 집단지성을 필요로한다고 생각하면 됨Boost는 여러 개의 앙상블 기법 중 하나임여러개의 분류기가 순차적으로 학습을 진행함이

CH 4. 분류 -1
지도학습 : 명시적인 정답이 있는 데이터가 주어진 상태에서 학습하는 머신러닝 방식→ 학습 데이터로 주어진 데이터의 피처와 레이블 값(결정 값, 클래스 값)을 머신러닝 알고리즘으로 학습해 모델 생성, 생성된 모델에 새로운 데이터 값이 주어졌을 때 미지의 레이블 값을 예측

XGB Tuning
이번에 처음으로 Optuna를 사용해보았다. 캐글러(Kaggler)들에겐 익숙한 자동화된 parameter tuning 방법이지만 범위만 지정해주면 빠르게 최적화된 parameter를 찾아준다는 것이 신기하면서도 믿기지 않았다. parameter space가 conve

[kaggle] - 안전 운전자 예측
Intro 캐글의 안전 운전자 예측 경진대회 'Porto Seguro's Safe Driver Prediction' compeition에 참가해 다양한 모델링 기법을 연습해보았다. Porto Seguro라는 브라질의 보험사에서 제공한 고객 데이터를 활용해 운전자가 보험

[캐글] 위스콘신 유방암 예측: XGBoost(eXtra Gradient Boost)
본 포스팅은 매주 토요일마다 진행되는 교재 '파이썬 머신러닝 완벽 가이드'를 활용한 스터디 활동 중에 작성한 포스팅입니다.머신러닝의 방식 中, '지도학습'은'지도학습':레이블(Label), 즉 명시적인 정답이 있는 데이터가 주어진 상태에서 학습하는 방식입니다.지도학습
[XGBoost Study] Appendix
출처: 코리 웨이드.(2022). XGBoost와 사이킷런을 활용한 그레이디언트 부스팅. 서울:한빛미디어 LightGBM CatBoost Reference LightGBM 논문 LightGBM 논문 리뷰1 LightGBM 논문 리뷰2 LightGBM - 고려대 강

[혼자 공부하는 머신러닝+딥러닝] - CH.5-3 Tree Ensemble
앙상블 학습: 더 좋은 예측 결과를 만들기 위해 여러 개의 모델을 훈련하는 머신러닝 알고리즘랜덤 포레스트: 대표적인 결정 트리 기반의 앙상블 학습 방법, 부트스트랩 샘플을 사용하고 랜덤하게 일부 특성을 선택하여 트리를 만듦엑스트라 트리: 랜덤포레스트와 비슷하게 결정 트
[XGBoost Study] Ch10. XGBoost 모델 배포
출처: 코리 웨이드.(2022). XGBoost와 사이킷런을 활용한 그레이디언트 부스팅. 서울:한빛미디어
[XGBoost Study] Ch9. 캐글 마스터에게 배우기
출처: 코리 웨이드.(2022). XGBoost와 사이킷런을 활용한 그레이디언트 부스팅. 서울:한빛미디어테이블 형태의 데이터(행과 열로 구성)에서 우수한 성능을 보임LightGBM (MS 개발)과 경쟁 구도개별 모델의 예측이 중요하지만, 더 높은 성능 달성을 위해서는
[XGBoost Study] Ch4. 그레이디언트 부스팅에서 XGBoost까지
출처: 코리 웨이드.(2022). XGBoost와 사이킷런을 활용한 그레이디언트 부스팅. 서울:한빛미디어 부스팅 부스팅: 개별 트리의 실수로부터 학습 이전 트리의 오차를 기반으로 새로운 트리를 훈련하는 것 잔차(=실제값 - 예측값)를 활용 개별 트리가 이전 트리를

[MachineLearning] PUBG 승률 예측 머신러닝 모델링 - 배린이 탈출 프로젝트
PUBG Finish Placement Prediction 캐글 대회였던 PUBG 최종 승자 예측의 데이터를 활용하여 배그 초보자들에게 고수들이 어떻게 행동하는지를 데이터 근거와 함께 조언을 주려는 목적으로 ML프로젝트를 진행하였습니다.

파이썬 머신러닝 완벽 가이드 - 5. Classification(2) (앙상블)
: 여러 개의 분류기(classifier)를 생성하고 그 예측을 결합함으로써 보다 정확한 최종 예측을 도출하는 기법→ 보팅Voting, 배깅Bagging, 부스팅Boosting + 스태킹Stacking보팅 : 서로 다른 알고리즘을 가진 분류기 결합배깅 : 같은 유형의