예측을 위해 여러 region으로 stratifying or sementing 하는 방법론
회귀와 분류 모두에서 사용 가능
연차와 안타수를 통해서 구역을 나누고, 이를 트리형태로 나타냄
트리 함수를 쓰는 이유?
해석력 --> 구역을 복잡하게 만들지 않고 직사각형의 형태로 보기 쉽게 나타냄
용어 정리
Terminal nodes : 결정 트리로 나뉘어진 Region, leaf라고도 표현 --> 트리의 마지막 부분들
결정 트리는 terminal node가 아래에 오도록 upside down 형식으로 그림
Internal nodes : predictor space가 나뉘어지는 부분 --> 쪼개지는 부분들
회귀 결정 트리
결정 트리는 predictor space를 보통 사각형 또는 box 형태로 나눔
이는 예측 모델의 간단성과 해석의 용이함을 위한 것
회귀 결정 트리는 RSS(residual sum of squares)를 최소화하는 boxes R1,...,Rj를 찾는 것이 목적
--> RSS : MSE와 비슷하지만 평균을 내는 것이 아닌 다 더해주는 형태의 Loss Function