중간에 추가된 일
중간에 취소된 일
불순도:
불순도는 군집에 다른 클래스가 얼마나 섞여있는지에 대한 정도로, 불순도자체가 높고 낮음이 중요한게 아니라 이 불순도가 다음 가지로의 판단 기준이 되는 것이 중요하다.(불순도는 0~1의 값을 가진다)
같은 클래스만 모여있으면 불순도는 0이다.
다른 클래스와 1:1비율로 섞여있으면 불순도는 최고치인 1이다.
accuracy와 f1-score
get score로 해당 분석의 accuracy와 f1-score를 알 수있는데, 이는 높을 수록 좋은 의미이다 (0~1)의 값을 가진다.
뭐가 중요한데?
accuracy가 중요한 경우는 클래스의 숫자가 균일할 경우이다.
f1-score는 클래스가 중구난방으로 일정하지 않게 섞여있을 경우 이다.
따라서 보통 f1-score가 높은쪽을 사용하게 된다.
물론 f1-score는 재현율과 정확도로 분류되는데 어떤것을 중요시 여기는가에 따라 분류가 다르기도 하다.
예) 재약관련 도메인의 경우 재현율을 좀더 중요시 여긴다.
-암에 걸렸는데 암이 아니라고 판정한 경우
오늘 배운 아티클은 엑셀또한 DB로 볼수 있다는 점이 었다. 차이점은 기본적으로 권한이 자유로운지 부여되어있는지, 사용자와 관리자가 분리되었는지, 코드로 작업하는가, 마우스나 기본기능으로 작업하는가의 차이가 있었다.
온세상이 머신러닝 ㅠㅠ 그래도 끝이 보이기 시작했다. 프로젝트 들어갔을때를 상정한 코드정리를 하는중인데.. 첩첩산중이다. 내일도 아티클이 있는데 어떤 새로운 지식을 줄지 기대된다.