'가치 함수' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록가치 함수 (1)

move84

강화 학습: Markov Decision Processes (MDP) 기본 사항

강화 학습(Reinforcement Learning, RL)은 에이전트가 환경과 상호 작용하며 학습하는 방법론입니다. 에이전트는 환경 내에서 특정 목표를 달성하기 위해 일련의 행동을 취하고, 그에 따른 보상을 받습니다. Markov Decision Processes (MDP)는 강화 학습의 핵심 개념으로, 에이전트가 최적의 의사 결정을 내릴 수 있도록 수학적 프레임워크를 제공합니다. 본 블로그 게시물에서는 MDP의 기본 사항과 핵심 구성 요소를 자세히 살펴보겠습니다.🧠 Markov Property (마르코프 성질 / 마르코프 속성)MDP의 핵심은 Markov Property입니다. 이 성질은 현재 상태가 미래를 완전히 결정하며, 과거의 모든 상태는 현재 상태가 주어지면 미래에 영향을 미치지 않는다는 것..

강화학습 2025. 4. 5. 12:36

이전 Prev 1 Next 다음

목록가치 함수 (1)

move84

티스토리툴바