What is Machine Learning ? > Machine Learning is “the field of study that gives computers the ability to learn without being explicitly programmed.”
Generalization (일반화) 학습에 사용된 데이터가 아닌 처음 보는 새로운 데이터에 대해 올바른 예측을 수행하는 능력 what is good model ? 머신러닝에서 좋은 모델은 현재 데이터를 잘 설명하며, 미레 데이터에 대한 예측 성능이 좋은 모델이다
Linear Regression (선형 회귀) 데이터를 가장 잘 설명하는 모델을 찾아 입력값에 따른 결과값을 예측하는 알고리즘 완벽한 예측은 불가능하기 때문에, 데이터의 실제값과 예측값의 차이를 최소한으로 하는 선을 찾아야한다. 선형 회귀는 크게 두 가지 종류로
데이터 불균형 문제 대부분의 분류 알고리즘은 학습 데이터에 범주간 비중이 비슷할 때, 각 범주의 특징을 충분히 학습할 수 있다. 하지만 현실 상황에서는 특정 범주가 다른 범주에 비해서 매우 적은 경우가 많다. 표본 수가 상대적으로 많은 class를 majority c
모델의 성능을 높이기 위해 단순히 많은 feature를 사용하는 것이 항상 좋은 것은 아니다. 불필요한 feature가 많아질수록 모델은 학습 데이터에 과도하게 적합되는 overfitting 문제가 발생할 수 있다. 이를 방지하기 위해 feature selection
## Logistic Regression (로지스틱 회귀) <br> Logistic Regression (로지스틱 회귀)란 Binary Classification (이진 분류) 문제를 해결하기 위한 모델이다. ex) 스팸 메일, 질병 양성/음성 분류 등 Sigm