Deep Learning
Deep Q Network (DQN)
Deep Deterministic Policy Gradient (DDPG)
AI (Artificial Intelligence)
ML (Machine Learning)
DL (Deep Learning)
지도 학습
비지도 학습
강화 학습
사람의 뇌와 유사한 방법으로 정보 처리
뉴런을 모밥한 기본 단위 집합으로 구성
원하는 값 학습 -> 가중히 w, 편향 b 학습하는 것
가중치 학습하는 것 중 가장 많이 사용하는 ReLU
y = x if x >=0
y = 0 if x < 0
입력층, 은닉층, 출력층
-> forward Propagation
결과와 이미 알고 있는 Target값과 비교
<- BackPropagation (은닉층에 가중치들 학습 실행하게 된다)
=> 정답과 유사하게 학습
이때, 출력값과 정답을 비교할때 사용하는 것 : loss 학습
=> loss 함수를 최소화 하도록 weight, bias를 학습하는 것이 목표!!
Underfitting : 학습이 부족하여 제대로 된 예측 수행 x
Good fitting : 적절하게 학습 수행
Overfitting : 과도하게 학습이 수행, training set에 대해서는 좋은 예측이지만 처음 보는 데이터에는 나쁜 성능
Dropout
-> overfitting 방지하는 기법 중 하나, 특정 확률에 따라 뉴런을 0으로 만들어서 네트워크에 변화 줌