1. 학습한 내용
① 마크다운 markdown 작성법
https://gist.github.com/ihoneymon/652be052a0727ad59601
② Google Teachable Machine
https://teachablemachine.withgoogle.com/
③ Azure Cognitive Services
https://azure.microsoft.com/ko-kr/services/cognitive-services/#features
④ Classification 실습
- 이미지 분석을 위한 Add-on 설치
- 주제 : 붓꽃(Iris) 품종 예측
- Data
- 3개 품종 분꽃 (Iris setosa, virginica and versicolor)
- 4개 변수 측정 (petal 길이, 넓이 and sepal 길이, 넓이)
- Dataset Iris
- Box Plot
- petal의 넓이가 sepal의 넓이보다 값이 덜 겹친다. 따라서 petal의 넓이가 sepal 넓이 보다 분류에 더 영향을 준다.
- Distributions
- Tree Viewer
- Test and Score
- Tree, Logistic Regression, kNN 알고리즘의 결과를 AUC, CA, F1, Precision, Recall등의 지표로 평가할 수 있다.
- CA(정확성)이 1이면 overfit된 상태이며, 학습한 데이터에 대해 분석이 아니라 답을 외워버린 상태로, 다른 데이터의 예측이 힘들어진다. 따라서 좋지 않은 모델이다.
- Confusion Matrix
- Data Sampler
- Data Sampler의 output의 선을 더블 클릭하면 다음 대화상자가 팝업된다.
- Fixed proportion of data : 선택한 비율 만큼 Data를 선택하고, 나머지는 Test Data로 이용
- Fixed sample size : 고정된 Data 수 만큼 샘플링
- Cross validation : Number of subsets 만큼 Data를 분할한다. 반할한 후, 한 부분과 나머지 부분이 Data와 Test Data가 된다. 계속해서 다음 부분도 나머지 부분의 Data와 Test Data가 되어진다.
- Confusion Matrix
- 주제 : 중국집 메뉴 예측
- Data
- 3개 메뉴 (menu1, menu2 and menu3)
- 3개 변수 측정 (image RGB 3 Color)
- 이미지가 input으로 들어갈 때, 벡터화되며 군집을 이룬다.
- Import Images
- Image Embdding
- Distances
- Distance Map
- Distance Matrix
- Hierarchical Clustering
- Image Viewer
- 짬뽕, 짜장면, 탕수육으로 적잘하게 분류되었다.
- 음식 자체로만 학습한 것이 아니라, 배경화면도 영향을 끼치기 때문에 배경화면이 같은 짜장면이랑 탕수육이 같은 분류에 속해있기도 하다.
- 라벨링을 통해 학습할 부분을 지정할 수 있다.
⑤ Using the Cognitive Servies
2. 학습내용 중 어려웠던 점
3. 해결방법
4. 학습소감
- Microsoft MVP 김영욱 강사님의 강의 내용을 들을 수 있어서 영광입니다.