Regression - LightGBM

이윤택·2022년 8월 2일

Data Science Regression machine learning

0

Data Science

목록 보기

6/11

LightGBM is a gradient boosting framework that uses tree based learning algorithms.

간단히, 기존 GBM들보다 훨씬 더 빠르게 학습이 되는 모델이다

이미지 출처 : https://lightgbm.readthedocs.io/en/latest/Features.html

기존의 GBM들은 Level-wise 방식으로 Tree를 빌드했다
Level-wise : DT가 학습을 할 때, 같은 level에 있는 노드들을 모두 split한 뒤 다음 level로 넘어가는 방식 (Breadth-First Search)
깊이가 너무 커지면 overfitting될 가능성이 높으므로 level을 제한하여 최대한 모델을 키우는 방식을 사용해왔다 (Model Generalization)

업로드중..

이미지 출처 : https://lightgbm.readthedocs.io/en/latest/Features.html

Level-wise 방식이나, Leaf-wise 방식이나 모두 최적화(optimal)를 만들게 된다면 비슷한 DT를 만들게 될 것
다만, Leaf-wise를 사용하면 훨씬 더 빠른 시간에 optimal을 찾을 수 있다
전체 Loss가 줄어드는 방향으로 노드를 선정하여 split. Level을 유지하려는 경향을 버린다
필요한 노드들만 split하면 되기 때문에, 기존의 GBM들에 비해 훨씬 빠르게 학습 가능
적은 데이터를 사용하게 되면 overfitting이 될 가능성이 높음 (10,000 rows 이상일 때 사용 권장)
다른 GBM들에 비해 하이퍼파라미터에 민감함 (특히 max_depth)

데이터 엔지니어로 전향중인 백엔드 개발자입니다

이전 포스트

Regression - XGBoost

다음 포스트

Clustering - K means

0개의 댓글