Coursera Machine Learning 강의 듣고 정리하기

  • Day 1. Introduction

What is machine learing?

  • Machine Learning이란?
    • 내용을 분명하게 프로그램하지 않으면서 컴퓨터에게 학습할 능력을 주는 학문분야
    • 어떤 과제 T에 대한 성능이 P라고 측정되고 경험 E를 통해 향상된다면 프로그램은 과제 T에 대해 경험 E로부터 성능 기준 P에 따라 학습한다고 할 수 있다
  • 예시상황:
- 이메일 프로그램이 사용자가 어떤 이메일이 스팸인지 아닌지 표시하는 것을 지켜보고 있다고 가정. 
- 이메일 클라이언트에서, 유저가 어떤 이메일을 스팸 처리하고, 아닌건 그냥 둠
-> 이때, 경험 E, 과제 T, 성능 P가 각각 대응되는 것은?

- 경험 E: 사용자가 스팸과 스팸이 아닌 라벨을 분류하는 것
- 과제 T: 이메일을 스팸과 스팸이 아니라는 것으로 분류하는 일
- 성능 기준 P: 잘못 분류 된 이메일의 비율
  • 학습 알고리즘
    • Maching Learning Algorithms
    • supervised learning: 지도 학습은 컴퓨터에게 무언가를 어떻게 하는지 가르치는 것
    • unsupervised learning: 자율 학습은 컴퓨터에게 스스로 배우라고 시키는 것
    • Others: Reinforcement learning, recommender system

Supervised Learning

  • 알고리즘한테 정확한 답을 알고있는 데이터(data set)을 주고, 답을 모르는 상황을 주었을 때 더 올바른 답을 만들어 내도록 하는 것.
  • regression problem VS. classification problem
구분 classification regression
특징 categorical continuous
예시 암환자 예측(양성/음성) 부동산 가격 예측

Unsupervised Learning

  • 알고리즘한테 dataset만 주는 경우, 알고리즘이 데이터셋을 분류함(clustering algorithms)
  • 예시) 구글링 해서 하나의 뉴스를 클릭했을 때, 그와 유사한 토픽의 다른 기사들도 보여주는 것.

Review

  • DSSchool에서 데이터 기초반 듣고 있는데 Supervised Learning에서 똑같은 예시가 나와서 더 이해가 잘 됐다.
  • 중간중간 수업 내용을 잘 이해했는지 팝 퀴즈가 나오는데 덕분에 더 집중하게 됨!
  • 강의 정말 귀에 쏙쏙 들어온다!!! 한글 자막 최고!!!! 머신러닝 분야는 사실 크게 관심 없었는데 급 관심 생기는 중. 열심히 들어야지