: t번째 입력(language model일 경우 : 단어). 단어를 50000개를 쓴다면 는 50000짜리 원-핫 벡터일 수도 있고, 줄어들어서 얻어진 word embedding일 수도 있다.
: hidden state(Output).
Previous cell state : 내부에서만 흘러가는 time step 0부터 t까지 들어왔던 t+1개의 정보를 모두 취합해서 summarize해줌
Previous hidden state : 이전의 출력값. 정보가 쭉 흘러서 다음번 t+1번째의 LSTM에 Previous hidden state로 들어간다.
LSTM의 입력 : , Previous hidden state, Previous cell state
LSTM의 출력 : hidden state, Next hidden state, Next cell state. 하지만 Next hidden stated와 Next cell state는 LSTM 내부에서만 입력받고 출력되는것이고, 실제로 외부로 출력되는 값은 hidden state 하나이다.