Lecture 1

리치·2023년 3월 24일
0

CS229

목록 보기
1/21
post-thumbnail

deep.daiv 동아리에서 진행했으며 팀원과 함께 정리한 내용입니다.

Lecture 1

What is machine learning?


가장 널리 인용되는 머신러닝의 정의:

Arthur Samuel (1959): Field of study that gives computers the ability to learn without being explicitly programmed

What is Supervised Learning(지도 학습)?


정답이 있는 데이터셋을 학습한다.

Regression(회귀)

Most widely used machine learning tool

목표: x값으로부터 y값을 얻어내는 것

주택 크기로부터 가격을 예측하는 것

주택 크기로부터 가격을 예측하는 것

  1. x를 기반으로 y를 정확히 예측하는 함수를 찾는 방법.
  2. 데이터 사이에 직선으로 맞추는 것이 가장 간단한 방법이다. 꼭 직선이 아니라 2차함수 일수도 있고, 데이터 특성에 따라 다르다.
  3. y값이 실수이고 연속적인 값(continuous value)을 가진다.

Classification(분류)

종양이 악성인지 아닌지 구분하는 의학적인 분류문제

tumor size에 따라서 악성인가, 아닌가에 대한 분류

tumor size에 따라서 악성인가, 아닌가에 대한 분류

  1. y값이 오직 1, 0 두가지만 가진다.
  2. 분류는 회귀와 다르게 y가 불연속적인 값을 가진다.

What is Unsupervised Learning(비지도 학습)?


정답이 없는 데이터 셋을 학습한다.

find structure, pattern in the data

find structure, pattern in the data

  1. figure out interesting structure in this data
  2. Clustering algorithm: Label 이 주어지지 않은 데이터를 서로 다른 cluster 로 구분짓는 알고리즘
  • Example of unsupervised Learning 1) Clustering news: 새로운 기사들을 조사해 연관성이 있는 것 끼리 묶어 토픽을 구분
    2) Clustering users in sns: 자주 연락하는 친구, 혹은 그룹에 따라 사람을 구분
    3) Astronomical data analysis
profile
이것저것

0개의 댓글