Notice
Recent Posts
Recent Comments
Link
반응형
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- rnn
- GRU
- 머신 러닝
- 딥러닝
- 강화학습
- LSTM
- 회귀
- Machine Learning
- 과적합
- 신경망
- AI
- reinforcement learning
- q-러닝
- 데이터 전처리
- 손실 함수
- 인공 신경망
- 정규화
- 강화 학습
- 분류
- 인공지능
- 머신러닝
- 최적화
- Deep learning
- Q-Learning
- CNN
- 지도 학습
- 교차 검증
- 자연어 처리
- python
- 활성화 함수
Archives
- Today
- Total
목록보상 정규화 (1)
move84
강화 학습: 강화 학습에서의 보상 정규화
강화 학습(Reinforcement Learning, RL)은 에이전트가 환경과 상호 작용하며, 시행 착오를 통해 학습하는 기계 학습의 한 분야이다. 에이전트는 환경으로부터 보상(Reward)을 받으며, 이 보상을 최대화하는 방향으로 행동(Action)을 학습한다. 이 과정에서 보상의 크기와 분포는 학습의 속도와 안정성에 큰 영향을 미친다. 보상 정규화(Reward Normalization)는 이러한 보상의 문제를 해결하기 위한 중요한 기술 중 하나이다. 🧠 보상 정규화란 무엇인가요? (What is Reward Normalization?)보상 정규화는 강화 학습에서 에이전트가 받는 보상의 크기를 조정하는 기술을 의미한다. 보상 정규화의 목표는 보상의 크기나 범위를 일정하게 만들어 학습을 안정시키고, ..
강화학습
2025. 4. 8. 08:08