Andrew Ng - Machine Learning Introduction

jaehee kim·2020년 7월 26일
post-thumbnail

coursera에서 Andrew Ng 교수님의 Machine Learning 강의를 듣고 정리하였습니다.

ML:Introduction


What is Machine Learning?

Arthur Samuel

"the field of study that gives computers the ability to learn without being explicitly programmed."

컴퓨터가 명시적인 프로그램없이, 스스로 학습할 수 있는 능력을 연구하는 학문분야. 오래된 정의입니다.

Tom Mitchell

"A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E."

학습과제를 중심으로 정의하였습니다. 프로그램이 일정수준의 작업성능(P)을 가지고, 작업(T)을 수행할 때, 경험(E)이 증가함에 따라 작업(T)을 수행하는 성능(P)이 향상될 수 있습니다. 이 때 프로그램이 경험(E)으로부터 학습을 했다고 표현합니다.

체커게임을 예를 들어 적용해보면,

E = 같은 게임을 여러 번 반복하는 과정

T = 체커 게임을 하는 것

P = 프로그램이 다음 판을 새로운 상대로 했을 때, 이길 확률

Supervised Learning

우리가 알고리즘에게 데이터 집합을 주는데, 이때 정답을 같이 알려줍니다.

Regression : 연속된 값을 가진 결과를 예측합니다.

Classification : 불연속적인 결과 값을 예측합니다.

Example

Regression : 남녀의 사진이 주어졌을 때, 그들의 나이를 예측하는 것

Classification : 은행에서 어떤 사람에게 대출을 해줄 것인지 아닌지 예측하는 것

Unsupervised Learning

데이터가 주어질 때, 어떤 레이블도 갖고 있지 않거나, 모두 같은 레이블을 갖고 있거나, 아예 레이블이 없습니다.
그래서 우리에게 주어진 데이터에 대해서, 이 데이터를 이용하여 어떤 구조를 찾을 수 있는지 찾아내야합니다.
이러한 구조는 데이터들 사이의 관계를 이용한 클러스터링 기법 같은 것을 이용하여 얻을 수 있습니다.

칵테일 파티문제

칵테일 파티에서, 많은 사람들이 동시에 이야기 하는 것을 생각해볼 수 있는데, 이런 상황에서는 중첩되는 목소리가 많게됩니다.
칵테일 파티에서 두 사람이 있고, 각각 마이크를 가지고 있는데, 마이크의 거리가 각각 다르다고 해보겠습니다.

거리가 다르기 때문에, 각 마이크는 다른 조합의 목소리를 녹음하게 됩니다.

이 두가지의 녹음을 unsupervised learning 알고리즘인 칵테일 파티 알고리즘을 이용하여, 데이터의 구조를 찾아봅시다.

결과물을 확인해보면 person1의 음성과 person2의 음성을 분리해냅니다.

Example

Clustering: 1000개의 에세이가 있을 때, 연관있는 것들끼리 자동으로 그룹화 하는것.

Non-clustering: 칵테일 파티 알고리즘처럼 뒤섞인 데이터에서 구조를 찾아내는 것.










notion 정리
[notion] Andrew Ng - Machine Learning Introduction

0개의 댓글