'reward normalization' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록reward normalization (1)

move84

강화 학습: 강화 학습에서의 보상 정규화

강화 학습(Reinforcement Learning, RL)은 에이전트가 환경과 상호 작용하며, 시행 착오를 통해 학습하는 기계 학습의 한 분야이다. 에이전트는 환경으로부터 보상(Reward)을 받으며, 이 보상을 최대화하는 방향으로 행동(Action)을 학습한다. 이 과정에서 보상의 크기와 분포는 학습의 속도와 안정성에 큰 영향을 미친다. 보상 정규화(Reward Normalization)는 이러한 보상의 문제를 해결하기 위한 중요한 기술 중 하나이다. 🧠 보상 정규화란 무엇인가요? (What is Reward Normalization?)보상 정규화는 강화 학습에서 에이전트가 받는 보상의 크기를 조정하는 기술을 의미한다. 보상 정규화의 목표는 보상의 크기나 범위를 일정하게 만들어 학습을 안정시키고, ..

강화학습 2025. 4. 8. 08:08

이전 Prev 1 Next 다음

목록reward normalization (1)

move84

티스토리툴바