시퀀스 데이터
- 시퀀스(Sequence) : 값이 연속적으로 이어진 자료형들을 총칭
- string, list, dict, set 등도 시퀀스 데이터
ex) 데이터들을 "Sequential" 하다
시퀀스데이터가 요소들의 연관성을 의미하는 것은 아니나 인공지능이 예측을 하려면 어느 정도는 연관성()이 있어줘야 함
ex) 문자열 ⇨ 문법 but 컴퓨터가 문법을 이해하기 어려우니 통계에 기반한 방법을 이용함
순환신경망(RNN)
- 특징 : 생성한 단어를 다시 입력으로 사용
- 언어모델(Language Model) : n−1개의 단어 시퀀스 w1,⋯,wn−1w가 주어졌을 때, n번째 단어 wnw으로 무엇이 올지를 예측하는 확률 모델
P(wn∣w1,⋯,wn−1;θ)θ:parameter
실습
(1) 데이터 전처리
(2) 인공지능 학습시키기
순환신겨망 RNN
RNN/LSTM 기본개념