Softmax함수는 뭘까? 딥러닝 교재나 활성화함수를 parameter로 지정할 때, 항상 softmax, sigmoid는 봐왔을 것이다. 단순하게 지수함수를 전체 지수함수의 합으로 나눈 값이 아닌 어떤 동작을 하는지, 왜 이름은 softmax인지 알고싶었다. Sof
하나로 묶은 입력 데이터를 배치(batch)라고 함즉, 묶음이란 의미임컴퓨터로 계산할 때 큰 이점을 준다. Why..??수치 계산 라이브러리 대부분이 큰 배열을 효율적으로 처리할 수 있도록 고도로 최적화 되어있어서커다란 신경망에서는 데이터의 전송이 병목으로 작용하는 경
미분이란?
계산 그래프(computational graph)란 계산하는 과정을 그래프로 나타낸 것이다. 그래프는 우리가 잘 아는 그래프 자료구조로, 복수의 노드와 에지로 표현된다. 계산은 왼쪽에서 오른쪽으로 진행되면 순전파(forward propagation), 오른쪽에서 왼쪽으
연쇄법칙(chain rule)이란 합성 함수의 미분에 대한 성질 이다.
역전파란 무엇일까?
Softmax-with-Loss 계층 계산그래프에 대해 알아보자