Banyc / reinforcement_learning Public

Notifications You must be signed in to change notification settings
Fork 0
Star 2

Dynamic programming. Value iteration methods. Monte Carlo controls. Q-learning.

2 stars 0 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 20 Commits
src		src
.gitignore		.gitignore
Cargo.lock		Cargo.lock
Cargo.toml		Cargo.toml
README.md		README.md

Repository files navigation

Value Iteration

prerequisites:
- finite Markov decision processes
- the agent knows environment dynamics accurately
  - $p(r, s' \mid s, a)$ for every variable

Monte Carlo

prerequisites:
- Markov decision processes
- episodic tasks

About

Dynamic programming. Value iteration methods. Monte Carlo controls. Q-learning.

machine-learning reinforcement-learning monte-carlo q-learning dynamic-programming

Report repository

Releases

No releases published

Packages

No packages published

Languages

Rust 100.0%