[TIL]RNN, LSTM

lena_log·2022년 3월 4일

Codestates Section4

목록 보기

7/12

언어모델이란
문장과 같은 단어 시퀀스에서 단어의 확률을 구하는 것
1) 통계적 언어 모델
단어 등장 횟수 기반으로 조건부 확률을 계산
한계) 희소성 문제
2) 신경망 언어 모델

순환신경망(RNN)
연속형 데이터: 순서가 달라지면 데이터의 의미가 달라짐
예) 자연어, 시계열

구조

장점: 간단, 이론적으로 어떤 연속형 데이터도 처리 가능
단점: 병렬화가 불가능

LSTM
기울기 정보 조절=> Gate 추가
3개의 게이트는?
:forget/input/output

Attention

안녕하세요. 기억보다 기록을 믿는 레나입니다!