*지도 학습(올바른 답이 레이블에 존재하는 것) : 분류(Yes or No와 같은 이진 분류, 개와 고양이 분류하는 다중 분류) / 회귀(연속적인 값을 찾는 것. 예측)
*비지도 학습(Input 데이터에 올바른 답이 없는 것이 주어짐) : 군집(구글 뉴스, 유사도) / 시각화
*준지도 학습 : 지도 학습 + 비지도 학습(페이스북의 사진으로 특정 계정을 태그하는 것)
*강화 학습 (예:알파고, 게임에 많이 적용)
*일반화 : Training 데이터와 Input 데이터가 달라져도 똑같은 성능으로 출력하기 위한 목적
*모델 : 데이터들에 부합하고 우리가 보지 못한 데이터들을 가지고도 잘 예측할 수 있는 과정
*특성 : 데이터를 설명하는 입력 변수(강아지, 고양이 분류 : 눈, 귀 모양, 성장 속도)
*레이블 : 예측하는 실제 항목
*추론 : 학습된 모델을 사용하여 새로운 데이터에 적용하여 예측
Numpy(라이브러리, 행렬 관련)
Pandas(라이브러리, 데이터 분석)
Matplotlib(라이브러리, 시각화)
Scikit-learn(라이브러리, 알고리즘을 사용할 수 있게 해주고 모델을 만들 때 사용)
*NLTK(라이브러리, 토큰화 처리, 자연어 처리)
*Colab 사용법