혼공머신 3주차
- Chapter 4) 다양한 분류 알고리즘
럭키백의 확률 - 생선 7종 중 당첨될 생선종류의 확률값 찾기
k-최근접 이웃 분류기로 확률 예측하기!!
k-최근접 이웃을 사용하면, 정해진 확률로만 결과가 나옴
예) 최근접 이웃 개수 3인 경우, 0/3 1/3 2/3 3/3의 확률이 전부임
로지스텍 회귀 이용하기
로지스틱 회귀는 선형 방정식을 사용한 분류 알고리즘으로, 모델 중 시그모이드 함수는 이진 분류를 위해 사용한다.
0.5 < z값, 양성클래스
0.5 > z값, 음성클래스
0.5 = z값, 0
- 시그모이드 함수 : 선형 방정식의 출력에 따라 0과 1 사이의 값으로 압축, 이진 분류를 위해 사용
- 소프트맥스 함수 : 다중 분류에서 여러 선형 방식의 출력 결과를 정규화하여 합이 1이 되도록 한다.
기존 훈련 데이터에 새로운 데이터를 추가하여 모델을 매일매일 다시 훈련하는 것!!
혼공머신과 함께 알고리즘에 대해 조금씩 알아가는 중!!
점점 어렵다는 느낌이 들지만, 두번 세번읽으면서 따라가고 있다.
한번에 다 이해할 거란 기대는 안했지만, 좀더 노력해야겠다.