GRU(Gated Recurrent Unit)

June·2022년 1월 16일

GRU는 LSTM과 비슷한 성능을 보이지만, 차이점은 LSTM은 3개의 Gate를 가지는 반면 Reset Gate(r)과 Update Gate(z)로 이루어져있다.

Reset Gate : 이전 상태를 얼마나 반영할지
Update Gate : 이전상태와 현재상태를 얼마만큼의 비율로 반영할지

Reset Gate

GRU와 LSTM 중 어떤 것이 모델의 성능면에서 더 낫다라고 단정지어 말할 수 없으며, 기존에 LSTM을 사용하면서 최적의 하이퍼파라미터를 찾아낸 상황이라면 굳이 GRU로 바꿔서 사용할 필요는 없다.

경험적으로 데이터 양이 적을 때는 매개 변수의 양이 적은 GRU가 조금 더 낫고,
데이터 양이 더 많으면 LSTM이 더 낫다고도 한다.
GRU보다 LSTM에 대한 연구나 사용량이 더 많은데, 이는 LSTM이 더 먼저 나온 구조이기 때문이다.

회사와 “함께” 성장하는 개발자