Notice
Recent Posts
Recent Comments
Link
반응형
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 강화 학습
- 자연어 처리
- 정규화
- 인공지능
- LSTM
- q-러닝
- 회귀
- AI
- GRU
- Q-Learning
- 강화학습
- 인공 신경망
- 딥러닝
- Machine Learning
- 지도 학습
- reinforcement learning
- 분류
- 과적합
- 머신 러닝
- 손실 함수
- 머신러닝
- Deep learning
- 활성화 함수
- 최적화
- CNN
- 교차 검증
- 데이터 전처리
- python
- rnn
- 신경망
Archives
- Today
- Total
목록reward normalization (1)
move84
강화 학습: 강화 학습에서의 보상 정규화
강화 학습(Reinforcement Learning, RL)은 에이전트가 환경과 상호 작용하며, 시행 착오를 통해 학습하는 기계 학습의 한 분야이다. 에이전트는 환경으로부터 보상(Reward)을 받으며, 이 보상을 최대화하는 방향으로 행동(Action)을 학습한다. 이 과정에서 보상의 크기와 분포는 학습의 속도와 안정성에 큰 영향을 미친다. 보상 정규화(Reward Normalization)는 이러한 보상의 문제를 해결하기 위한 중요한 기술 중 하나이다. 🧠 보상 정규화란 무엇인가요? (What is Reward Normalization?)보상 정규화는 강화 학습에서 에이전트가 받는 보상의 크기를 조정하는 기술을 의미한다. 보상 정규화의 목표는 보상의 크기나 범위를 일정하게 만들어 학습을 안정시키고, ..
강화학습
2025. 4. 8. 08:08