01. 머신러닝 정의 : 컴퓨터가 주어진 X값과 찾고자하는 값 Y 사이의 관계를 모델링하는 방법 Definition (from wiki): “A Computer program is said to learn from experience E with respect to
회귀(Regression) : 주어진 데이터(X)와 찾고자하는 값(y) 사이의 관계를 찾는 방법 01. Linear Regression > Linear Regression : $y=Wx+b$로 표시되는 선형식으로 x와 y 사이의 관계를 찾는 모델(W가 여러 개 이면
Lasso, Ridge : Linear Regression이 고차원 공간에 overfitting(너무 많은 feature가 있는 경우 전부다 고려해서 학습이 잘 안됨, generalization 잘 안됨)이 쉽게 되는 문제를 해결한 기법.weight의 L1 term(
Linear Classifier : y= Wx+b로 표시되는 선형함수로 데이터를 분류하는 모델.linear classifier는 하나의 선형식으로 데이터를 나누는 방법.38선으로 북한과 남한을 나누는 것을 생각해보면 직관적으로 이해하기 쉽.하나의 선형식으로 위/아래로
Logistic Regression : 주어진 데이터(x)를 통해서 사건의 발생 확률(y)를 예측하는 통계 모델 / Linear Regression을 분류 모델로써 확장한 모델. Linear Regression은 특정 수치값(numeric value, continuou
한국말: 비슷한거끼리 묶어(주어진 데이터 X 사이의 유사한 데이터들을 묶어주는 방법)서양언어: "clustering is the task of grouping a set of objects in such a way that objects in the same group
이진트리를 보완하는 방식으로 학습되는 앙상블 기법.(missclassified에 가중치 부여) + sequential(순차적 실행)Boosting 모델은 Bagging 방식이 만들어지는 원리가 전체 성능을 향상하는데 직접적인 연관이 없는 것을 보완한 모델(Bagging