ML 머신러닝이란..?
인공지능의 한 분야로서, 컴퓨터가 학습을 할 수 있도록 알고리즘과 기술을 개발하는 것을 뜻한다. 컴퓨터에게 여러가지 데이터를 공부하게 하고, 쌓여진 기존 데이터들로 새로운 데이터를 판단하기 위함을 말한다.
- Independent variable(독립변수)는 원인이다.
- dependent variable(종속변수)는 결과이다.
- 독립변수와 종속변수의 관계를 인과관계(causal relationship)라고 한다.
- 인과관계는 상관관계(correlation)에 포함된다.
Classification of ML (머신러닝의 분류)
지도학습이란:
정답이 있는 문제를 해결하는 것.
- 회귀(regresion): 미지의 데이터를 숫자로 유추해내고 싶을때 사용하는 방법.
example:
- 분류(classification):
- 데이터에 독립변수와 종속변수가 있고, 종속변수가 숫자일 경우, 회귀를 이용한다.
- 데이터에 독립변수와 종속변수가 있고, 종속변수가 이름일 경우, 분류를 이용한다.
비지도학습이란:
무언가에 대한 관찰을 통해 새로운 의미나 관계를 밝혀내는 것. 독립변수와 종속변수의 구분이 중요하지 않다. 역사를 바탕으로 탐험해서 데이터의 성격을 파악하는 것.
군집화(clustering):
데이터들을 표로 나태내고 가까운 점들끼리 집합시켜놓은 것. 아래 참조.
연관규칙(Association rule):
강화학습이란:
더 좋은 보상을 받기 위해서 수련하는 것.
ex)게이머가 게임을 계속 하면서 실력을 키우는 행위.