Notice
Recent Posts
Recent Comments
Link
반응형
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
Tags
- Deep learning
- 차원 축소
- 강화 학습
- reinforcement learning
- 인공 신경망
- 머신러닝
- AI
- 지도 학습
- 회귀
- 정규화
- 최적화
- 자연어 처리
- Q-Learning
- CNN
- 신경망
- Machine Learning
- 교차 검증
- python
- LSTM
- 인공지능
- 강화학습
- 데이터 전처리
- 과적합
- 손실 함수
- 딥러닝
- q-러닝
- 활성화 함수
- 머신 러닝
- rnn
- GRU
Archives
- Today
- Total
목록가치 함수 (1)
move84
강화 학습: Markov Decision Processes (MDP) 기본 사항
강화 학습(Reinforcement Learning, RL)은 에이전트가 환경과 상호 작용하며 학습하는 방법론입니다. 에이전트는 환경 내에서 특정 목표를 달성하기 위해 일련의 행동을 취하고, 그에 따른 보상을 받습니다. Markov Decision Processes (MDP)는 강화 학습의 핵심 개념으로, 에이전트가 최적의 의사 결정을 내릴 수 있도록 수학적 프레임워크를 제공합니다. 본 블로그 게시물에서는 MDP의 기본 사항과 핵심 구성 요소를 자세히 살펴보겠습니다.🧠 Markov Property (마르코프 성질 / 마르코프 속성)MDP의 핵심은 Markov Property입니다. 이 성질은 현재 상태가 미래를 완전히 결정하며, 과거의 모든 상태는 현재 상태가 주어지면 미래에 영향을 미치지 않는다는 것..
강화학습
2025. 4. 5. 12:36