DQN(Deep Q-Network)의 주요 아키텍처는 합성곱 신경망(CNN)을 중심으로 구성되며, 경험 리플레이(Experience Replay), 타겟 네트워크(Target Network)와 같은 학습 안정화 기법들이 핵심 요소이다[1][2][3].
이 구성과 과정 덕분에 DQN은 복잡한 고차원 환경(예: 아타리 게임 등)에서도 효율적이고 안정적으로 정책을 학습할 수 있다[1][2][3][8].
출처
[1][RL] 강화학습 알고리즘: (1) DQN (Deep Q-Network) https://ai-com.tistory.com/entry/RL-%EA%B0%95%ED%99%94%ED%95%99%EC%8A%B5-%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98-1-DQN-Deep-Q-Network
[2] 딥 Q-네트워크(DQN) 개요 및 실무 적용 사례 - learningflix https://learningflix.tistory.com/123
[3] DQN: Deep Q-Networks - DevSlem Blog https://devslem.github.io/reinforcement-learning/drl-methods/dqn/
[4] 강화학습 기초 5 - DQN https://velog.io/@s_s/%EA%B0%95%ED%99%94%ED%95%99%EC%8A%B5-%EA%B8%B0%EC%B4%88-5-DQN
[5] 강화 학습: Deep Q-Networks (DQN) 기본 이해 - move84 https://move84s.tistory.com/453
[6] 강화 학습 (DQN) 튜토리얼 - 파이토치 한국 사용자 모임 https://tutorials.pytorch.kr/intermediate/reinforcement_q_learning.html
[7][논문리뷰] Deep Q Network (DQN) - 정리노트 - 티스토리 https://roboharco12.tistory.com/63
[8] 강화학습 개념부터 Deep Q Networks까지, 10분만에 훑어보기 https://jeinalog.tistory.com/20
[9] 강화학습 논문 정리 3편 : DDQN 논문 리뷰 (Deep ... https://ropiens.tistory.com/134
[10][강화학습] SARSA와 DQN 개념 정리 - HIGHQUAL - 티스토리 https://mengu.tistory.com/139