Q-learning algorithm in python

Para executar o projeto é necessário ter o pip3 e o python versão 3 instalado em sua máquina.

Na pasta do projeto, execute

$ pip3 install -r requirements.txt

Após o fim do comando, execute

$ python3 q.py

Valores alteráveis no código:

Lista que define sobre quais gamas ocorrerá a execução (separar gamas por vírgula)

tipos_de_gama = [0.1,0.2,0.8,0.9,0.95, 0.5 , 0.4, 0.3, 0.7, 0.6]

porcentagem_escolha_maiores = 70

Define se o programa executará até o fim dos N episódios definidos, sem parar quando converge

roda_ate_o_fim = False

Define o gráfico será gerado com base na quantidade de passos do episódio executados ou na quantidade de execuções mesmo internas de quando está buscando o OBJETIVO

salvar_por_episodio = True

episodios = 1000

Tipos aceitaveis de convergencia: tipo_de_convergencia = 'conjunto_q' tipo_de_convergencia = 'lista_otima'

Gama para o cálculo de propagação de recompensas

gama = 0.5

Variável que define quantas vezes uma lista ficou sem mudar para ser convergência

quando_converge = 100

Variável que define partindo de quantas execuções a lista de caminho ótimo passará a ser buscada

quando_comeca_a_armazenar_lista_caminho_otimo = 5

Variável que define se a matriz Q será exibida de N em N episódios da execução Com o valor -1, não exibirá a matriz Q

exibir_matriz_q_de_n_em_n_passos = -1

Name		Name	Last commit message	Last commit date
Latest commit History 40 Commits
graficos		graficos
.gitignore		.gitignore
mapa_inicial.json		mapa_inicial.json
mapa_inicial.recompensas_certas.json		mapa_inicial.recompensas_certas.json
mapa_inicial.recompensas_zeradas.json		mapa_inicial.recompensas_zeradas.json
q.py		q.py
readme.md		readme.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Q-learning algorithm in python

Valores alteráveis no código:

About

Releases

Packages

Languages

11808s8/qlearning-python

Folders and files

Latest commit

History

Repository files navigation

Q-learning algorithm in python

Valores alteráveis no código:

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages