[KDT_AISEC] 2주차 - CNN & 순환신경망

Gloomy·2024년 1월 20일
0

KDT_AISEC

목록 보기
6/25

CNN(Convolutional Neural Network)


CNN 개요

  • 합성곱(Convolution)
    • 두 함수 f, g 가운데 하나의 함수를 반전, 전이시킨 다음, 다른 하나의 함수와 곱한 결과를 적분하는 것

    • 2차원 입력데이터를 1개의 필터로 합성곱 연산을 수행하는 과정

  • 채널
    • 컬러 사진은 천연색을 표현하기 위해서 각 픽셀을 RGB 3개의 실수로 표현한 3차원 데이터

  • 필터

    • 필터는 이미지의 특징을 찾아내기 위한 공용 파라미터

  • Stride

    • 지정된 간격으로 필터를 순회하는 간격
  • 패딩

    • Convolution 레이어에서 FilterStride의 작용으로 Feature Map 크기는 입력데이터보다 작음
    • 데이터가 줄어드는 것을 방지하는 작업이 패딩
  • Pooling Layer

    • 풀링 레이어는 컨볼루션 레이어의 출력 데이터를 입력으로 받아서 출력 데이터의 크기를 줄이거나 특정 데이터를 강조하는 용도로 사용

순환 신경망 - RNN, LSTM …


RNN

  • 순차형 데이터를 모델링하는데 최적화된 구조
  • 데이터가 입력되는 순서가 중요한 역할을 하는 순차형 정보를 수월하게 처리하기 위해
    • 이전 상태 기록
    • 이를 다음 셀에서 활용할 수 있는 독특한 구조
  • 상태들간의 순서라는 컨셉을 이해하는 것이 필수!

RNN의 다양한 형태

  • 여러 형태로 구성 가능

  • 입, 출력 단위는 벡터

  • 다 대 일

    • 긍정 / 부정 분류
    • 스팸 메일 분류
  • 다 대 다

    • 영어 번역기
    • 챗봇

LSTM (Long Short-Term Memory)


  • 장단기 메모리 알고리즘 → RNN은 심플 모델이기 때문에 바로 직전의 데이터만 기억할 수 있음
  • 나중을 위해 정보를 저장함으로써 오래된 시그널이 점차 소실되는 것을 막아줌

GRU (Gated Recurrent Unit)


  • 순차적 데이터 처리에 사용되는 순환 신경망의 한 유형
  • RNN에서 발생할 수 있는 그래디언트 소실 문제를 해결
  • 특히 시퀀스가 지나치게 길지 않은 작업의 경우 GRU는 LSTM과 같거나 더 나은 성능
    • 단, LSTM보다 항상 나은 것은 아님!

profile
𝙋𝙤𝙨𝙨𝙤 𝙁𝙖𝙧𝙚!

0개의 댓글