[Deep Learning] Recurrent Neural Network, RNN, 순환 신경망 (강의 12)

이수빈·2023년 6월 14일

Deep Learning RNN Recurrent Neural Network 순환 신경망

강의-딥러닝및응용

목록 보기

5/9

0 Recurrent Neural Network

☑️ what) automata와 같이 previous output을 current input으로 사용한다. → 이 때 input으로 사용되는 데이터는 과거 정보를 담고 있다고 할 수 있다. input data 각각을 학습 X, input data 순서까지 고려하여 학습 O

❓ why) RNN은 가변적인 input을 다루기에 적합하다. Feed-Forward(FF), CNN으로는 input의 길이가 가변적인 경우를 다룰 수 없다. input의 최대 길이를 정하기에도 무리가 있다.

➰ ex) 음성 인식, 시계열 예측

Sample FF Net	Sample RNN

	RNN은 input이 같아도, state(`h`)가 다르면 output이 다를 可

1 Vanilla RNN

FF Cell	Recurrent Neural Cell

$y_t = F(h_t)$	$h_t = tanh(Wx)$

1. Use

▶️ 감성 분석
▶️ Image Captioning

2. Input-Output Scenarios

1-1 $\ni$ FF
1-多 $\ni$ Image Captioning
多-1 $\ni$ 감성 분석
多-多 $\ni$ 번역, 비디오 Captioning
```
			
```

▶️ use) FF Image Captioning 감성 분석 번역, 비디오 Captioning

3. BackPropagation Through Time (BPTT)

펼쳐진 RNN에서 이전의 모든 데이터를 input으로 받는다. 이에 따라 W 값은 복사본이 계속 계산되고, 합쳐진다.
🥲 pb) Vanishing, Exploding Gradent

4. Issues with the Vanilla RNN

sol1) Sliding window

...

sol2) Gradient Clipping

gradient 값이 크면 줄인다. Exploding gradient를 예방할 수 있다.

sol3) LSTM

...

2 LSTM (Long Short-Term Memory)

☑️ what)"Constant Error Flow"에 착안하여 Long-Term dependency 문제를 해결한다. 이전 layer 상태 정보를 다음 layer로 전달할 때 weight를 사용하지 않고 Identity relationship을 사용한다.

how) Identity 관계를 구현하기 위해, 간단하게 memory cell 하나를 사용할 수 있다. (->Memory)