딥러닝_기초3일차

곽숭아·2026년 1월 17일

딥러닝🖍️

목록 보기

3/5

딥러닝 기초 3일차 정리
모델의 실전 근육키우기!! (일반화 & 정규화)

어떻게 가중치를 효율적으로 업데이트할 것인가에 대한 고민임.

역전파 : 출력층의 오차를 입력층 방향으로 거슬러 올라가며 전파하는 과정임. 이때 Chain Rule(연쇄법칙)이 핵심적인 역할을 함.
옵티마이저(Optimizer)의 진화
- SGD : 가장 기본적인 경사하강법. 단순하지만 일반화 성능이 의외로 좋을 때가 있음.
- Momentum : 관성을 추가하여 경사면을 따라 더 빠르게 내려가게 돕는다.
- Adm : 현재 가낭 많이 쓰는 국룰 옵티마이저. 방향(Momentum)과 보폭(RMSProp)을 동시에 고려하여 똑똑하게 최적화함.

모델이 특정 데이터에만 매몰되지 않도록 '제약'을 거는 방법들임.

Weight Decay(L2 Regularization) : 가중치( $W$ ) 값이 너무 커지지 않게 패널티를 줌. 모델이 특정 피처에 과도하게 의존하는 것을 방지함.
Dropout(드롭아웃) : 학습 시 무작위로 일부 노드르 '꺼버림'.이를 통해 모델이 특정 경로에 의존하지 않고 더 강건하(Robust)특징을 배우게 함.
Batch Normalization(배치 정규화) : 각 레이어를 통과할 때마다 데이터의 분포를 일정하게 맞춰줌. 학습 속도가 빨라지고 초기화에 덜 민감해지는 효과가 있음.