Scikit-learn 설치 를 하여, scikit-learn에 내장되어 있는 diabetes(당뇨법) 데이터를 불러올 수 있다. Data Set Characteristics: :Number of Instances: 442 :Number of Attrib
‣ data : diabetes sklearn을 이용하여 databetes 데이터셋을 분석해보자. diatbetes의 columns 이 외에도, 아래와 같은 코드들로 diabetes data를 탐색할 수 있다. : 예측할 때 사용될 diabetes의 featur
손실을 줄이는 알고리즘 !미분값(기울기)이 최소 가 되는 점을 찾아 알맞은 weight(가중치 매개변수)를 찾아낸다.linear regression의 경우 매끈한 모양으로 시작점은 별로 중요하지 않다. ( 매끈한 모양이 아니라면, 시작점을 찾는 것은 중요 ! )보통은
필요성 : 다중선형회귀모델에서, 예측변수 y가 범주형 (예 / 아니오 , 1 / 0 , 참 / 거짓, 합격 / 불합격 ) 이라면 오류가 발생한다. 따라서 로지스틱 회귀모형이 필요 ! 직선인 선형회귀로는 fitting이 어렵기 때문에 S자형 곡선인 로지스틱 함수를 이
정확도 (Accuracy) : $accuracy = (TP + TN) / (TP + TN + FP + FN)$정밀도 (Precision) : 모델이 Positive로 예측한 샘플 중 실제로 Positive인 샘플의 비율을 나타내는 지표 $precision = TP /
encoder = LabelEncoder()pd_data'Class' = encoder.fit_transform(pd_data'Class') pd_data.head()pd_data = pd.read_csv('Raisin_Dataset.csv', encoding = 'c
비선형, 계층적 구조노드로 구성, 부모와 자식의 관계2진 트리 : 부모 노드 - 2개의 자식 노드 (오른쪽 / 왼쪽) 리프(leaf) 노드 : 가장 마지막 노드분류 & 회귀 가능분류 각 노드에서 분할 조건 적용최종 leaf 노드에서 분류 예측회귀 특정한 값을 예측특
column 1 ~ 7 을 이용하여, 성별 (M, F, I) 를 예측업로드중..
<=50K, >50K (14) : target age (0) : continuous.workclass (1) : Private, Self-emp-not-inc, Self-emp-inc, Federal-gov, Local-gov, State-gov, Without
https://scikit-learn.org/stable/modules/clustering.html비지도학습 -> 타깃값이 없는 데이터로 학습여러가지 알고르즘으로 군집화https://scikit-learn.org/stable/modules/genera
단일 머신러닝보다 좋은 성능 (정확도, 속도)다수의 약한 머신러닝 모델을 종합 하여 최종 모델로 사용 --> 속도가 빠름다수의 모델 구축 -> 학습데이터 분할(병렬처리) / 재사용 필요단일 모델들의 취합 방법, 연결 방법에 따라bagging with replacemen