Skip to content

Comparação de diversos algoritmos de reinforcement learning considerando diversos ambientes

License

Notifications You must be signed in to change notification settings

fbarth/rl_compare

Repository files navigation

Comparando os algoritmos DQN, A2C e PPO

O objetivo deste projeto é comparar três algoritmos de reinforcement learning considerando alguns ambientes disponíveis na biblioteca Gymnasium. Os algoritmos que serão comparados são DQN, A2C e PPO.

Os ambientes que serão utilizados na comparação são:

Todas as implementações dos algoritmos citados acima serão feitas utilizando a biblioteca Stable Baselines 3.

Matriz de comparação

Documento com a matriz de comparação a ser executada neste projeto

Estrutura do repositório

Este repositório está estruturado da seguinte forma:

  • no diretório raiz estão todos os scripts que executam o treinamento, salvam os dados do treinamento e o modelo.
  • o diretório results deve armazenar todos os arquivos CSV com os dados dos treinamentos.
  • o diretório models deve armazenar todos os modelos gerados a partir do treinamento.

Comandos úteis

jupyter nbconvert --to html --no-input analise_curva_aprendizado.ipynb
mv analise_curva_aprendizado.html report/analise_curva_aprendizado.html

About

Comparação de diversos algoritmos de reinforcement learning considerando diversos ambientes

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published