Basic Machine/Deep Learning #1

남태우·2020년 11월 18일
0

목표

  • Machine learning basic concepts
  • Linear regression
  • Logistic regression(classification)
  • Multivariable (Vector) linear/logistic regression
  • Neural networks
  • Deep learning
    • CNN, RNN, Bidirectional Neural networks

Machine Learning

머신러닝(Machine Learning)

  • 일종의 소프트웨어 (프로그램)
1. 사용자가 사용하는 앱에 입력을 하게 되면, 입력의 기반으로 데이터를 읽어서 보여주는 것. explicit programming로 불림.

2. 어떤 부분에서는 explicit programming 으로 개발하기 어려움.
(스팸 메일을 구별) 룰이 많기 때문에 어려움.
3. 로직을 가지고 프로그래밍을 할 수 있지만 규칙이 너무 어려움.
  • Arthur samuel(1959) 일일히 프로그래밍하지말고 어떤 자료, 현상으로 자동으로 배우면 어떨까?
  • 개발자가 일일이 정하지 않고 이 프로그램 자체가 데이터를 학습해서 배우는 프로그램을 머신 러닝이라 부릅니다.

Supervised/UnSupervised learning

  • 머신 러닝을 할 때 프로그램은 학습을 해야 한다.

  • 학습하는 방법에 따라서 2개로 분류

    • Supervised learning
      정해져 있는 (레이블 되어있는) 데이터, training set
      예) 사람들이 고양이 그림을 먼저 주면서 (레이블이 달려있는) 학습을 합니다.

    • Unsupervised learning
      구글 뉴스가 있는데 자동적으로 유사한 것들을 그룹핑 합니다. 레이블하지 않고 학습을 합게 됩니다.
      비슷한 단어들도 모으라는 머신러닝이 있다면, 레이블을 직접 만들어 주는 것이 아니라 데이터를 보고 스스로 학습하는 것입니다.

Supervised learning

  • ML에서 가장 일반적인 문제입니다.
  • 이미지 레이블링을 한다던지, 이메일 스팸 필터링 레이블을 매겨 놓은것들을 학습합니다.
  • 이전 사람들이 몇시간 공부했는데 성적이 얼마였다 등의 데이터가 있으면 그 데이터를 가지고 학습을 할 수 있습니다.

Training data set

xy
3, 6, 93
2, 5, 92
2, 3, 51

이런 데이터의 레이블을 가지고 학습을 합니다. 학습을 통해 생성된 모델을 가지고
Test x의 값이 [9, 3, 6]을 모델에 넣으면 3 이라는 y값을 얻을 수 있습니다.

Type of supervised learning

  • regression
    얼마나 시간을 많이 썻냐에 대한 기반으로 시험 성적을 예측한다고 하면 시험성적은 0~100이라고 큰 범위를 가지기 때문에 regression이라 부릅니다.
x(hours)y(score)
1090
980
350
230
  • binary classification
    문제를 단순화 시켜, pass, fail로 나눈다면, 둘 중에 하나를 고르는 것이기 때문에 분류이게 됩니다.
x(hours)y(pass/fail)
10P
9P
3F
2F
  • multi-label classification
    학점을 나눠서 준다고하면 (A, B, C, D, E, F), multi-label classification이게 됩니다.
x(hours)y(grade)
10A
9B
3B
2C
profile
brand-new

0개의 댓글