RSDP_DNN_Neural Network

지토·2022년 7월 20일

그래프는 수식과 동일하다

식을 정하고, 어떤 값이 들어가면 나온 값을 결과로 cost function 을 정의하고, 실제 값과의 차이로 인해 내가 지금 정한 parameter 의 값을 수정하는 과정을 반복한다.

Neural Network 는 사람의 뉴런을 모방한 perceptron 이라는 것을 만들어, 이 퍼셉트론은 여러 개의 입력을 받아 계산을 한 후 하나의 출력을 내는 것이다. 이 연산이 되는 본체는 hidden layer 이라고 한다.

그렇다면 deep 이라는 것은 무엇을 의미하는가?

hidden layer 가 2개 이상인 뉴럴 네트워크를 딥 뉴럴 네트워크라고 한다.

Softmax

이 중에서 어떤 네트워크가 가장 좋을까?

one-hot encoding

원-핫 인코딩이란 가장 큰 값을 1로 두고 나머지를 0으로 두는 것이다.

하지만 이는 마지막에 결과를 선택할 때만 사용하며, ground truth 와 네트워크 결과값을 비교할 때는 원-핫 인코딩을 사용하지 않는다.
즉 실제로 뉴럴 네트워크를 사용하는 시점인 evaluation 단계에서 사용하며 training 단계에서는 사용하지 않는다.

We should produce output in probability domain of which sum is 1.
There are several ways to represent variables to probability.
Monotonically (단조 증가 함수) function is used.

결과값을 확률값으로 바꿔 보자.

결과값은 음수도 있을 수 있고 그래서 연산할 수 있게 확률변수로 바꿔주는 (정규화하는) 것이다.

개개별의 값을 양수로 만들어줘야 하기 때문에 monotonically increasing function 중에서 지수함수를 주로 사용하고, 지수함수의 밑은 여러 개 있을 수 있지만 그 중에서도 자연로그를 밑으로 하는 지수함수에 매핑 하는 것을 softmax 라고 한다.