強化学習

このリポジトリは，強化学習に関するアルゴリズムをJupyterLab, python, pytorch, OpenAIを用いて実装することで，アルゴリズムの理解やpythonのライブラリに慣れることを目的としております．

実装済み

動的計画法を用いた状態価値関数値の導出
動的計画法を用いた行動価値関数値の導出
反復方策評価
再帰処理と反復処理の比較
モンテカルロ法
モンテカルロ法を用いたCartPole問題の解決

実装中

TD法を用いた価値関数値の導出
Sarsaを用いたMountainCarの実装

注意事項

Jupyter上でファイルを開くことを想定しているため，Github上で~.ipynbを開くとフォーマットが少し崩れることがあります．
OpenAI Gymは(Macの場合)，Xhostコマンドを実行し，Xtermを起動させてから実行させてください．

reinforcement-learning

Implementation about Reinforcement Learning Algorithms.
For example, Dynamic programing, Monte Carlo method, Temporal Difference Learning, Deep Q Learning, and so on.
Exercise using JupyterLab, python, pytorch, OpenAI.

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
DP		DP
MC		MC
TD		TD
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

強化学習

実装済み

実装中

注意事項

reinforcement-learning

About

Releases

Packages

Languages

rrrrind/reinforcement-learning

Folders and files

Latest commit

History

Repository files navigation

強化学習

実装済み

実装中

注意事項

reinforcement-learning

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages