SKN10-10-4

최수헌·2025년 3월 14일
post-thumbnail

오늘은 RNN 배우는 날~

어제 배운거 살짝 요약

first-order-system

딥러닝에서 못하는 순서 정보를 학습하는 모델임.
초기상태값(0, 랜덤)을 지정해줘야한다는 단점이 있음.
초기상태값을 지정하고 순서대로 토큰을 하나씩 넣어 학습하는 방식임.

state 뭐시기 모델

각 단계에서 현재 상태값을 액티브 펑션에 통과 시켜 어떤 결과(y)를 뽑아내는 모델임.

RNN

CNN은 이미지의 위치, 구역 정보를 학습한다 치면,
RNN은 시간 정보를 학습하는 거임.

RNN 구조

  • one to many: 사용하는거 본적이 없음.
  • many to one: 주로 감석분석에 사용, 예)"철수는 영희를 좋아해" -> True or False
  • many to many: 주로 번역에 사용, 예)"철수는 영희를 좋아해" -> "Cheolsu likes Yeonghee"

1. Embedding Layer

임베딩 모델의 입력값은 무조건 정수임. 실수 이런거 안됨.

잡다

0개의 댓글