Named Entity Recognition(NER)
NER : find and classify names in text
possible uses :
Tracking mentions of particular entities in documents
For question answering, answers are usually named entities.
Simple NER : Widow classification using binary logistic classifier
idea : window의 주변 단어로부터 center word의 entity를 classify하는것
Train logistic classifier on hand-labeled data to classify center word {yes/no} for each class based on a concatenation of word vectors in a window
hand-labeled : center word가 어떤 entity인지를 레이블해둔것이다.
To classify all words: run classifier for each class on the vector centered on each word in the sentence
Jacobian Matrix
if f(x) is a function Rn→Rm
then f(x)=[f1(x1,x2,…,xn),…,fm(x1,x2,…,xn)]
than Jacobian matrix is
Elementwise activation Function
여기서
이걸 짚고 가자면,
∂ui∂(∑k=1nukhk)=hi
∂u∂(uTh)=⎣⎢⎢⎢⎢⎡h1h2⋮hn⎦⎥⎥⎥⎥⎤=h 이어야 하는데 (u가 column vector이므로 scalar을 u로 미분하면 column vector가 나와야함) 계산상의 편의로 hT로 설정한다.
(이러한 경우가 ML에서 상당히 많다고 한다.... 이거 때문에 애먹었는데..)
Backprop
∂W∂s=δ∂W∂z=δ∂W∂(Wx+b)=δTxT
zi의zWij에 대한 미분에 대해 생각해보자.
예를 들어 W23은 z2만을 미분할 수 있고, i = 2가 아닌 모든 i에 대해 zi값에 대한 미분은 0이 된다.
따라서
가된다.