의 축을 갖고 있는 평면 4개의 dots를 생각해보자.
(0,0)
(1,0)
(0,1)
(1,1)
이때 단 한 개의 직선을 이용해서 오른쪽 그림과 같이 O, X로 나누어 보자
→ 선형 분류
1, 2번째는 직선 하나로 쉽게 분리할 수 있지만, 3번째 그림은 분류하기 어렵습니다.
세 번째 평면의 경우는?
그림의 X & O를 단 하나의 직선으로 나타낼 수 있을까?
없습니다. 이 문제를 XOR problem이라 부릅니다.
X를 숫자 0, O를 숫자 1로 재지정한 후 아래의 표를 참고해 봅니다.
결과값(Output)이 숫자로 이루어진 경우에는 파라미터를 이용하여 0과 1을 도출해 낼 수 있다.
→ Perceptron
3번째 평면의 결과값인 (0,1,1,0)은 double layer perceptron을 이용하여 해결이 가능하다.
이제 ()를 ()으로 ()을 (3,3,-4)로,
()을 ()로 그리고 ()을 ()으로 놓아보자
마찬가지로,
() → (),
() → (),
() → ()
와 같이도 설정이 가능하다.
퍼셉트론의 계산 과정을 아래를 참고
그전에 행렬에 대한 개념과 곱셈의 방법을 알고 있어야 합니다.
머신러닝에서는 행렬에 대해 잘 알고 있는 것이 아주 중요한데요.
그 이유는 데이터를 표현하는데 있어 행렬 형식으로 데이터를 표현하는 것이 일반적이기 때문입니다.
행과 열로 이루어진 어떠한 수, 식을 표현한 것을 행렬이라 하며,
행렬의 곱셈은 위의 이미지를 참고해주세요.
이것을 행렬로 나타내면 어떻게 될 것인가?
해당 연산과정을 통해 어떻게 output
이 나오는지의 과정을 이해하면 좋을 것 같다.