A dinâmica, você move uma raquete e bate a bola em uma parede de tijolos no topo da tela. Seu objetivo é destruir a parede de tijolos. Você pode tentar quebrar a parede e deixar a bola causar estragos do outro lado, tudo por conta própria! Você tem cinco vidas.
| Espaço de Açãos | Discreto(18) |
| Espaço de Observação | (210, 160, 3) |
| Observação Alta | 255 |
| Observação Baixa | 0 |
| 2 | Mover Direita |
| 3 | Mover Direita |
Você marca pontos destruindo tijolos na parede. A recompensa por destruir um tijolo depende da cor do tijolo.
Será necessário :
Pode importar facilmente esssas dependências atraves do Anaconda-navigator
Import no anaconda o arquivo 'agentBreakout.yaml' localizado na pasta ambienteAnacondaExecute o arquivo em src 'train.py' Execute o arquivo em src 'agentTest.py'
É preciso especificar o caminho do agente treinado na variável 'a2c_path'Na pasta logs execute o comando
tensorboard --logdir=.TensorBoard 2.9.1 at http://localhost:6006/ (Press CTRL+C to quit)Python
Anaconda-navigator
Gym
Stable-baselines3
Tensorboard