아이리스 분류법
Versicolor Setosa Virginica
직접 잰 데이터(꽃받침 조각 등)인 실데이터를 사용해 분석
ROC : receiver operation characteristic
TP(긍정적 진실) 와 FP(긍정적 거짓) 를 축으로 분석
feature에 rabel을 붙이는것을 라벨링
(V) : visualize 시각화
(M) : Model 모델
(V)box plot : 어떤 수치가 상한선을 넘지 못하는것을 보여주는데 효과적
겹치는 부분이 있다= 변별력 없음
(M)Tree : 양자택일의 반복으로 분류를 하는 것
(V)Tree viewer : tree 모델을 보여주는 것
(E)Confusion Matrix
실제 데이터와 예측의 정확도를 측정
Regression 회귀 : 곡선을 가지고 값을 계산
(M)Logic Regression : 선을 가지고 분류한다 A/B
Accuracy(CA, 정확도) : 실제 true를 true로, 실제 false를 false로 예측한 것의 비율
AUC : ROC 그래프 아래의 면적
값자체는 크면 클수록 좋다
Accuracy가 100% 인것도 문제다
왜? '그' 자료에만 맞는 지표기 때문, 범용성이 없다
Over fitting, Under fiting
preprocess
Data Sampler
subset 10 : 데이터를 10개로 나누고, 10번의 결과를 내고 종합해서 결과치를 냄
1~10을 이용해서 -> 2~10을 이용해서 -> '''
분류화 도와주는 사이트
https://teachablemachine.withgoogle.com/
computer vision 하는 사이트임
classification-object detection 객체 탐지
XX 인식 서비스
https://azure.microsoft.com/ko-kr/services/cognitive-services/#features
마크다운 사용법
https://gist.github.com/ihoneymon/652be052a0727ad59601