Notice
Recent Posts
Recent Comments
Link
반응형
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- 데이터 전처리
- 자연어 처리
- 강화 학습
- reinforcement learning
- python
- Q-Learning
- 딥러닝
- 지도 학습
- CNN
- 과적합
- LSTM
- Machine Learning
- 최적화
- 머신 러닝
- rnn
- q-러닝
- 머신러닝
- 회귀
- 활성화 함수
- 인공지능
- 손실 함수
- 인공 신경망
- 교차 검증
- 강화학습
- 차원 축소
- AI
- 정규화
- GRU
- 신경망
- Deep learning
Archives
- Today
- Total
목록ddqn (1)
move84
딥러닝: 학습 안정성을 위한 Double DQN
🤖 딥러닝 분야에서, 특히 강화 학습은 매우 흥미로운 영역입니다. 하지만, DQN(Deep Q-Network)과 같은 기본적인 강화 학습 알고리즘은 학습의 불안정성이라는 문제에 직면하곤 합니다. 이 글에서는 DQN의 이러한 문제점을 해결하고 학습의 안정성을 향상시키는 Double DQN(이하 DDQN)에 대해 자세히 알아보겠습니다. 💡 DQN의 문제점: 과대평가 (Overestimation)DQN은 Q-value를 추정하기 위해 딥 뉴럴 네트워크를 사용합니다. 이 네트워크는 상태-행동 쌍에 대한 Q-value를 예측하는데, 여기서 문제는 과대평가의 경향이 있다는 것입니다. 과대평가는 Q-value가 실제 값보다 높게 추정되는 현상을 의미하며, 이는 학습 불안정성의 주요 원인 중 하나입니다. 과대평가는..
딥러닝
2025. 3. 26. 01:10