머신러닝에서 사용되는 데이터는 크게 정형 데이터와 비정형 데이터로 나뉩니다.N x P 형태의 표형 데이터(Table Data)행(row)과 열(column)로 이루어진 구조적인 데이터주로 Excel Data와 같은 테이블 형태로 저장됨예제: X1, X2, X3, ...
회귀 분석에서는 종속 변수(Y)를 설명하는 독립 변수(X)와 이를 조정하는 계수(β)를 추정하는 것이 핵심입니다.단순 선형 회귀(Simple Linear Regression):다중 선형 회귀(Multi-Linear Regression):여기서 은 오차항(Error Te
머신러닝 모델을 평가하는 과정에서 다양한 지표를 활용하여 성능을 측정한다. 모델의 성능을 비교하기 위해 공통된 평가 기준을 적용하며, 대표적인 성능 지표에는 R-Squared, 평균 오류, 평균 절대 오차, 평균 제곱 오차 등이 있다. 본 글에서는 이러한 지표들을 설명
선형 회귀(Linear Regression)는 하나 또는 여러 개의 독립 변수(X)를 이용하여 종속 변수(Y)를 예측하는 통계적 기법입니다.단순 선형 회귀(Simple Linear Regression): 독립 변수(X) 1개, 종속 변수(Y) 1개다중 선형 회귀(Mul
모델이 너무 단순하면(Bias가 높음) underfitting이 발생하고, 모델이 너무 복잡하면(Variance가 높음) overfitting이 발생함.모델의 복잡도를 조절하면서 Bias와 Variance의 균형을 맞추는 것이 중요함.Feature Selection을
Ridge Regression은 회귀 모델에서 과적합(Overfitting)을 방지하기 위해 정규화(Penalty Term)를 추가하는 기법이다.회귀 계수(β)의 크기를 제한하기 위해 β²에 패널티를 부여한다.Ridge Regression을 적용할 경우 Feature
Ridge Regression과 Lasso Regression 비교 분석Ridge Regression은 L2 정규화를 활용하여 회귀 계수(β)의 크기를 제어하는 기법이다.목적: 회귀 모델이 과적합(Overfitting)되지 않도록 패널티 항(Penalty Term)을
ElasticNet 회귀 분석 정리ElasticNet은 Ridge Regression과 LASSO Regression을 결합한 모델입니다. 두 기법의 장점을 동시에 활용할 수 있도록 설계되었습니다.Ridge 회귀 (L2 정규화)와 LASSO 회귀 (L1 정규화)를 혼합