파이팅!
머신러닝을 공부하기 위한 준비물 ...
김 팀장🗣️ "직원이 물고기 종류 구분을 못 하네... '무게'와 '길이' 데이터를 바탕으로 도미와 빙어를 구분하는 모델을 만들어줘!"
김 팀장🗣️"근데, 네가 훈련할 때 쓴 데이터로 평가를 하면 당연히 정확도가 100% 나오는 거 아냐...?"ㅇ ㅁㅇ ....
김 팀장🗣️ "문제가 생겼어. 길이 25cm, 무게 150g이면 분명 도미일 텐데 자네 모델은 빙어라고 예측한다는군?" ㅇ ~ㅇ....
김 팀장🗣️ "농어의 무게 데이터가 56개 빼고 다 날아갔어... 길이 데이터는 있는데, 혹시 이것만 보고 농어의 무게를 예측하는 모델을 만들어 줄 수 있을까? 무게가 측정되어있는 샘플 56개를 메일로 보내줄게."
🗣️"그 농어는 1.03kg 정도로 예측됩니다! ... 네...? 실제 무게는 1.5kg이라구요...?" ㅠ zㅠ
김 팀장🗣️ "뭐야, 높이랑 두께 데이터도 있으면서 왜 안 썼어? 선형회귀는 특성이 많을수록 효과가 뛰어나니까, 여러 개의 특성을 함께 적용해 봐!"
✴️한빛 럭키백 출시✴️ 고객들에게 럭키백에 포함된 생선의 확률을 알려줄 수 있을까?
김 팀장🗣️ "이제는 7개의 생선 말고 새로운 생선도 추가될 거고, 수산물들이 오는 족족 분류모델을 업데이트 해야 해. 기존 데이터를 유지하면서 새로운 데이터가 올 때마다 조금씩 훈련시킬 수 있겠어?"
김 팀장🗣️ "레드와인인지 화이트와인인지 표시가 누락됐어.. 캔에 인쇄된 알코올 도수, 당도, pH 값으로 와인 종류를 구별할 수 있겠어?"
이사님🗣️ "최적의 모델을 찾는 건 좋은데, 그 과정에서 자꾸 테스트 세트로 평가를 하면 테스트 세트에만 잘 맞는 모델이 되어버리는 거 아닌가요?"
이사님🗣️ "베스트 머신러닝 알고리즘을 찾아보게나!"
🍎농산물 시장까지 진출한 한빛마켓!🍌 이젠 고객이 필요한 과일 사진을 보내면, 그게 어떤 과일인지 구별하는 모델이 필요해졌다. 근데 손님들이 어떤 과일을 보낼지 알 수 없는데 훈련을 어떻게...?
🆖사실 저번엔 제대로 된 비지도학습 아니었음.. 전달받은 이미지 300개가 어떤 과일인지 정말 모르는 상태에서, 대표 이미지(=평균값)을 구할 수 있을까?
🚨고객들이 보낸 과일 사진이 너무 많아지면서, 저장공간이 부족해졌다... 업로드된 사진의 용량을 좀 압축시킬 수는 없을까?
이번엔 패션 럭키백이다! 홍 선배🗣️ "생선 럭키백에 썼던 로지스틱 회귀 알고리즘보다 정확도를 높일 순 없을까..."
홍 선배🗣️ "오 인공신경망이 역시 좋네~ 신경망은 층 더 많이 쌓을 수도 있다며?"
🛠️신경망 모델을 훈련할 때 알아야 할 다양한 도구들🛠️
혼공학습단 6주차를 돌아보며
2023.02.27