범주형 변수 처리에 특화된 boosting 기반 알고리즘이며 Level-wise 방식의 트리 확장기법 및 Ordered Boosting 방식을 사용하는 특징이 있음
Level-wise 트리 확장기법: 대칭적인 트리 구조로 트리를 확장해나감(XGBoost의 ‘depthwise’와 동일
level-wise 트리 확장기법
Ordered Boosting: 일부 데이터만 가지고 잔차계산을 한 뒤, 모델을 만들어 나머지 데이터의 잔차를 이 모델로 예측한 값을 활용
장점
단점
주요 하이퍼파라미터
Iterations=500
트리의 최대 개수
learning_rate=0.03
단계별 모델의 가중치
depth=6
개별 트리의 깊이
l2_leaf_reg=3
L2 규제의 계수
rsm=None
단계별 트리 적합 시 사용할 변수의 비중
feature_border_type='GreedyLogSum'
수치형 변수를 이산화할 때 로직
{'Median', 'Uniform', 'UniformAndQuantiles', 'GreedyLogSum', 'MaxLogSum', 'MinEntropy'}
nan_mode=’Min’
수치형 변수의 결측치 처리방식
{‘Forbidden’: 결측치 제외, ‘Min’:최소값 대체, ‘Max’: 최대값 대체