머신러닝을 위한 매우 대양한 알고리즘과 개발을 위해 편리한 프레임워크와 API를 제공한다. 많은 환경에서 사용되는 성숙한 라이브러리이다. 주로 Numpy와 Scipy(science.확률,통계,과학적인 연산들)위에서 구축된 라이브러리이다. 머신러닝 용어정리 feature: 데이터 세트의 일반 속성이다. 머신러닝은 2차원 이상의 다차원 데이터에서도 많이 사용...
GridSearchCV를 이용해 Classifier나 Regressor와 같은 알고리즘에 사용되는 하이퍼 파라미터를 순차적으로 입력하면서 편리하게 최적의 파라미터를 도출할 수 있다.
search space, 목적함수, 목적함수의 최소값을 찾는 함수
회귀는 여러 개의 독립변수와 한 개의 종속변수 간의 상관관계를 모델링하는 기법을 통칭한다.
regression: 데이터포인트x에 해당하는 실제 값으로 주어지는 타겟y를 예측하는 과제 > linear regression: 예측함수가 입력 feature들의 선형 조합으로 표현 Model 예시) 주택 가격 예측 input: area,age $$price=w{area}⋅area+w{age}⋅age+b$$ d개의 변수가 있을 경우의 model $$ŷ...
1.Linear Classifier와 Loss Function >리니어 분류기 리니어 분류기는 입력 데이터를 레이블 점수에 매핑하는 함수 f를 사용합니다. 마진 기반 손실과 교차 엔트로피 같은 손실 함수는 학습 과정에서 모델의 성능을 정량화합니다. 빠른 테스트와 적은