독립 변수가 종속 변수에 미치는 직접적인 영향의 크기를 나타내는 계수
쉽게 말해, 한 변수의 변화가 다른 변수에 얼마나 영향을 미치는지를 수치로 표현한 것입니다.
경로계수는 보통 회귀계수와 유사한데, 이는 변수 간의 직접적인 관계만을 나타내며, 경로계수의 값은 표준화된 값(표준화 경로계수)일 수도 있고, 그렇지 않을 수도 있어요(비표준화 경로계수).
구조방정식 모델(Structural Equation Modeling, SEM)이나 회귀분석 같은 통계 모델에서 사용되는 용어 중 하나
구조방정식 모델이나 회귀분석 등에서 어떤 독립변수가 종속변수에 미치는 간접적인 영향력의 통계적 유의성을 검정한 결과를 의미
P-value가 0.1이라는 것은, 귀무가설(변수 간에 간접 효과가 없다는 가설)을 기각할 증거가 상대적으로 약하다는 것을 나타냅니다.
일반적으로 P-value가 0.05 또는 그 이하일 때, 결과를 '통계적으로 유의미하다'고 해석합니다.
따라서 P-value가 0.1인 경우, 간접 효과가 통계적으로 유의미하다고 보기 어렵지만, 완전히 무시할 수 없는 가능성을 내포하고 있다고 할 수 있어요.
여러 개의 결정 트리(Decision Tree)를 조합하여 강력한 예측 모델을 만드는 앙상블 기법 중 하나
예측 성능이 높고 과적합에 강한 특성을 가지고 있어 다양한 분야에서 널리 사용됩니다.
Gradient Boosted Trees의 작동 원리는 다음과 같습니다
첫 번째 트리 학습 -> 오차에 대한 두 번째 트리 학습 -> 이러한 과정을 반복 -> 앙상블 모델 구성
시계열 데이터를 작은 윈도우(부분 시계열)로 나누어 각 윈도우에 대한 분석을 수행하는 기술
각 윈도우는 연속적인 시간 범위를 가지며, 예를 들어 1일부터 7일까지의 데이터를 포함하는 주간 윈도우 등이 있을 수 있습니다.
이렇게 나눈 윈도우에서는 해당 기간 동안의 통계량, 평균, 분산, 계절성 패턴 등을 파악하여 시계열 데이터에 내재된 패턴을 이해하고 모델을 구축할 수 있습니다
윈도잉을 사용하면 시계열 데이터의 복잡한 패턴을 더 잘 이해하고 모델을 더 효과적으로 구축할 수 있습니다. 이를 통해 미래의 값 예측이나 이상치 감지 등을 수행할 수 있습니다.