딥러닝 기초 4일차 정리!
데이터 맞춤형 구조 (CNN & RNN),
모든 데이터를 MLP로만 해결할수 있을까? 딥러닝의 진정한 강점은 데이터의 특성에 맞춰
행렬곱의 구조를 커스터마이즈 할수 있다는 점!
1.이미지의 공간 정보를 읽는 CNN(Convolutional Neural Network)
이미지는 인접한 픽셀 간의 관계가 중요함. 이를 위해 탄생한 것이 합성곱(Convolution) 연산임.
-
핵심 개념
- Convolution(합성곱) : 필터(커널)가 이미지를 스캔하며 특징을 추출함. 과거에는 사람이 필터를 설계했지만, CNN은 필터 속 숫자 자체를 학습함.
- Padding & Stride : 이미지 크기를 유지하거나(Padding), 필터가 이동하는 간격(Stride)을 조절하여 특징 추출의 밀도를 결정함.
- Pooling : 중요한 정보만 남기고 데이터 사이즈를 줄여 계산 효율을 높인다.(예 : Max Pooling)
-
장점
- 이미지의 지역적 특징을 잘 잡아낸다.
- 슬라이딩 윈도우 방식이지만, 같은 필터로 한꺼번에 연산이 가능해 병렬 연산(GPU)에 매우 유리함.


2.흐름을 기억하는 RNN(Recurrent Neural Network)
주식 가격, 날씨, 텍스트처럼 순서(Sequence)가 중요한 데이터에 사용됨.
- 핵심 구조 : 이전 시점(t-1)의 연산 결과가 다음 시점(t)의 입력으로 들어가는 순환 구조임.
- 한계점
- Long-term Dependency : 문장이 길어지면 앞부분의 정보를 잊어버리는 '기억력의 한계'가 있음
- 병렬 연산 불가 : 이전 연산이 끝나야 다음 연산을 할 수 있어 속도가 느림.
- 진화된 RNN
- LSTM / GRU : 'Gate'라는 구조를 도입하여 어떤 정보를 기억하고 잊을지 스스로 결정하게 만들어 RNN의 단점을 보완함.
- 실무에서는 보통 양방향 다층(Bi-LSTM)구조가 국룰로 통함.

수업에서 강조된 시간/공간 복잡도와 병렬 연산 가능 여부임.

4.실무 데이터 Shape 이해하기
RNN류를 다룰 때 가장 헷갈리는 데이터 형태를 꼭 기억해야함!!
- Input Shape : (배치 사이즈, 시계열 길이, 특징 차원)
- 예시 : 환자 1명의 5일간 맥박/체온/호흡 데이터 -> (1, 5, 3)
💡요약
- 이미지는 CNN으로 공간적 특징(필터 학습)을 잡는다.
- 시계열은 RNN(LSTM)으로 흐름을 잡지만, 병렬 연산이 안 된다는 단점이 있다.
- 현재는 RNN의 단점을 극복하고 병렬 연산이 가능한 Transformer 구조가 대세로 자리 잡았다.