Cues
유사도 라는 것에 의해 사물의 분류가 정해 진다면 이것은 search 의 일종이 아닌가?
단순히 미니멈을 찾는 것으로는 변수를 수정할 수가 없고 만약 직접 변수를 할당하면 i 가 날아감
크기와 붉은 정도와 같은 특징 추출에 있어 서의 "특징"은 어떠한 데이터에 의해 저장이 되는 가?
그렇다면 사실 차선책을 따라가는 탐욕 알고리즘의 일종이 아닌가?
만약 X - Y 축 그래프를 그려야 한다면 맥시멈 기준으로 사용할 특징은 고작 2가지 인가?
좋은 특징이란?
Notes
KNN 에서 무언가를 분류할 때 그래프 상에서 가까운 노드 들이 얼마나 많은 가에 의해 결정.
넷플릭스 등에서의 추천 시스템은 대상 유저와 취향이 가장 비슷한 5 명의 고객이 좋아하는 영화를 추천해주는 방식이다.
유사도를 특정하려면 아래의 이미지처럼 size, color saturation 같은 특징을 추출해야한다.
아래와 같이 그래프를 만든다 (X, Y 축은 위의 각 특징들에 따라)
이 들간의 거리는 피타고라스의 정리를 사용한다.
위의 예시에 대한 수식은 다음과 같다.
그래프 뿐만 아니라 집합으로 나타내는 방법도 있다.
회귀 분석 (regression analysis) 는 위의 예시에서 평점을 예측할 때도 쓰인다.
KNN (분류: 그룹으로 나누기) / 회귀 (숫자로 된) 반응을 예측하기
가령 빵집을 운영할 때 오늘 몇개의 빵을 만들어야 할지 예측하고 싶다면...
코사인 유사도(Cosine similiary) 가 실무에서 더 많이 이용된다.
머신러닝 이란?
만약 특정 인물들의 평점에 가중치를 주고 싶다면 명수를 늘리듯 가중치를 할당.
Summary