Notice
Recent Posts
Recent Comments
Link
반응형
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- LSTM
- 강화학습
- 인공 신경망
- q-러닝
- reinforcement learning
- 최적화
- 신경망
- AI
- 교차 검증
- 머신 러닝
- 지도 학습
- 자연어 처리
- 활성화 함수
- 회귀
- 강화 학습
- CNN
- 과적합
- 인공지능
- Deep learning
- 머신러닝
- 데이터 전처리
- python
- Q-Learning
- 손실 함수
- Machine Learning
- rnn
- 딥러닝
- 정규화
- GRU
- 분류
Archives
- Today
- Total
목록잠재 기반 보상 형성 (1)
move84
강화 학습: 강화 학습에서의 보상 형성 (Reward Shaping)
강화 학습(Reinforcement Learning, RL)은 에이전트가 환경과 상호 작용하며 학습하는 머신 러닝의 한 분야입니다. 에이전트는 환경으로부터 보상(Reward)을 받으며, 이 보상을 최대화하는 방향으로 행동을 학습합니다. 그런데, 복잡한 환경에서는 에이전트가 원하는 목표에 도달하기까지 많은 시간과 시행착오가 필요할 수 있습니다. 이러한 학습 과정을 가속화하고, 에이전트의 성능을 향상시키기 위해 보상 형성(Reward Shaping)이라는 기법이 사용됩니다. 보상 형성이란, 에이전트가 특정 행동을 하거나, 특정 상태에 도달했을 때 추가적인 보상을 제공하여 학습을 유도하는 방법입니다. 이 글에서는 보상 형성의 개념, 장단점, 그리고 실제 구현 예시를 자세히 살펴보겠습니다.—🚀 보상 형성의 개..
강화학습
2025. 4. 6. 09:56