머신러닝 개념 정리

素人·2022년 1월 21일
0

Data

목록 보기
10/30

*지도 학습(올바른 답이 레이블에 존재하는 것) : 분류(Yes or No와 같은 이진 분류, 개와 고양이 분류하는 다중 분류) / 회귀(연속적인 값을 찾는 것. 예측)

*비지도 학습(Input 데이터에 올바른 답이 없는 것이 주어짐) : 군집(구글 뉴스, 유사도) / 시각화

*준지도 학습 : 지도 학습 + 비지도 학습(페이스북의 사진으로 특정 계정을 태그하는 것)

*강화 학습 (예:알파고, 게임에 많이 적용)

*일반화 : Training 데이터와 Input 데이터가 달라져도 똑같은 성능으로 출력하기 위한 목적

*모델 : 데이터들에 부합하고 우리가 보지 못한 데이터들을 가지고도 잘 예측할 수 있는 과정

  • 좋은 모델은 데이터들의 패턴을 잘 학습한 모델!
  • 상황에 따라 적합한 모델을 찾는 것이 중요함

*특성 : 데이터를 설명하는 입력 변수(강아지, 고양이 분류 : 눈, 귀 모양, 성장 속도)

*레이블 : 예측하는 실제 항목

*추론 : 학습된 모델을 사용하여 새로운 데이터에 적용하여 예측

Numpy(라이브러리, 행렬 관련)
Pandas(라이브러리, 데이터 분석)
Matplotlib(라이브러리, 시각화)
Scikit-learn(라이브러리, 알고리즘을 사용할 수 있게 해주고 모델을 만들 때 사용)
*NLTK(라이브러리, 토큰화 처리, 자연어 처리)

*Colab 사용법

profile
매일 조금씩:)

0개의 댓글