머신러닝(Machine Learning)이란 명시적으로 프로그래밍하지 않고도 컴퓨터에 학습할 수 있는 능력을 부여하는 학문 (과거 데이터로부터 얻은) 경험이 쌓여감에 따라 주어진 task의 성능이 점점 좋아질 때, 컴퓨터 프로그램은 경험으로부터 학습한다고 할 수 있음
label_encoder(문자->숫자로 변환) 데이터 만들기 label encoder란 대상이 되는 문자로 된 데이터를 숫자-카테고리컬한 데이터로 변환해줌 -> array(['a', 'b', 'c'], dtype=object) -> 'a'-0, 'b'-1, 'c
모델평가의 개념 회귀모델은 실제 값과의 에러치를 가지고 계산해서 평가 가능 분류모델의 평가 항목이 조금 다양함(정확도, 오차행렬, 정밀도, 재현율, ..) 이진 분류모델(0,1을 맞힘)의 평가는 4가지(TP, FN, TN, FP) > TP (True Positive)
Basic of Regression 지도학습1 - 분류(Classification) -> 출력이 0 혹은 1 지도학습2 - 회귀(Regression) -> 출력이 연속된 값(continuous value)임 비지도학습1 - 군집 비지도학습2 - 차원 축소 회귀 : e