# Demo do projeto

Através deste notebook é possível testar o funcionamento do nosso projeto de uma forma ágil e simples. Está dividido em várias secções cujo objetivo é facilitar a compreensão geral da simulação e dos algortimos de aprendizagem utilizados.

Podemos separar este notebook nas seguintes secções úteis:
* Teste da simulação e comportamento do agente com o agente aleatório
* Política fixa, análise de desempenho para os problemas
* Algoritmo genético + Redes Neuronais para ambos os problemas
* Aprendizagem por reforço para ambos os problemas

De notar que o nosso projeto foi criado para ser configurado através de ficheiros, nomeadamente: ficheiro do controlador, da simulação e do(s) agente(s). Por agora, os modelos de aprendizagem apenas funcionam com 1 agente, algo que poderá mudar mais tarde.

**Conteúdo dos ficheiros**:
* Ficheiro do Controlador: modo (se teste se aprendizagem); problema (se recoleção, se farol); ficheiro do motor de simulação usado e os vários parâmetros dos algoritmos
* Ficheiro do Motor de Simulação (independente do modo ou do problema): nº de passos máximos; descrição do ambiente (tamanho e elementos) e ficheiro(s) dos agente(s)
* Ficheiro do Agente: id; posição inicial; ângulo inicial e sensor

Como nos apercebemos que pode ser complicado gerir os ficheiros, criámos este notebook para que fosse agilizado o processo de teste.

#### *Funções Auxiliares Fixo e Aleatório*

In [20]:
from controlador import criarControlador

def resetFarol(ficheiro_controlador, ficheiro_simulacao, ficheiro_agente,politica):
    texto_controlador = f"A\nF\n{politica}\nMS {ficheiro_simulacao}"
    texto_simulação = f"5\n50\nAG {ficheiro_agente}\n E farol (3,3) False False 100\nE parede (1,2) False True 0\nE parede (1,3) False True 0\nE parede (1,4) False True 0"
    texto_agente = "1\n(0,0)\n0\nS (0,-1) (0,1) (1,0)"

    with open(ficheiro_controlador, "w", encoding="utf-8") as f:
        f.write(texto_controlador)
    with open(ficheiro_simulacao, "w", encoding="utf-8") as f:
        f.write(texto_simulação)
    with open("agentes/"+ficheiro_agente, "w", encoding="utf-8") as f:
        f.write(texto_agente)

def changeTest(ficheiro_controlador):
    with open(ficheiro_controlador, "r", encoding="utf-8") as f:
        linhas = f.readlines()
    linhas[0] = "T\n"
    with open(ficheiro_controlador, "w", encoding="utf-8") as f:
        f.writelines(linhas)



def resetRecolecao(ficheiro_controlador, ficheiro_simulacao, ficheiro_agente,politica,tempo):
    texto_controlador = f"A\nR {tempo}\n{politica}\nMS {ficheiro_simulacao}"
    texto_simulação = f"5\n50\nAG {ficheiro_agente}\nE ninho (3,3) False False 0\nE parede (1,2) False True 0\nE ovo (2,1) True False 10"
    texto_agente = "1\n(0,0)\n0\nS (0,-1) (0,1) (1,0)"

    with open(ficheiro_controlador, "w", encoding="utf-8") as f:
        f.write(texto_controlador)
    with open(ficheiro_simulacao, "w", encoding="utf-8") as f:
        f.write(texto_simulação)
    with open("agentes/"+ficheiro_agente, "w", encoding="utf-8") as f:
        f.write(texto_agente)

## Teste da Simulação com o Agente Aleatório

### Farol

In [21]:
ficheiro_controlador = "controladorAleatorio_farol.txt"
resetFarol(ficheiro_controlador,"simulação_farol_aleatorio.txt","agente_aleatorio_farol.txt","aleatorio")

In [22]:
controlador = criarControlador(ficheiro_controlador)
controlador.executa()

In [23]:
changeTest(ficheiro_controlador)
controlador = criarControlador(ficheiro_controlador)
controlador.executa()

A * . . .
* . . . .
. P . . .
. P . F .
. P . . .
. . . . .
A * . . .
* P . . .
. P . F .
. P . . . 

. * . . .
. A * . .
. * . . .
. P . F .
. P . . . 

. . * . .
. . A * .
. P * . .
. P . F .
. P . . . 

. . * . .
. * A . .
. P * . .
. P . F .
. P . . . 

. * A * .
. . . . .
. P . . .
. P . F .
. P . . . 

. * A * .
. . * . .
. P . . .
. P . F .
. P . . . 

. . . A *
. . . * .
. P . . .
. P . F .
. P . . . 

. . . A *
. . . * .
. P . . .
. P . F .
. P . . . 

. . . . A
. . . . *
. P . . .
. P . F .
. P . . . 

. . . . A
. . . . *
. P . . .
. P . F .
. P . . . 

. . . . A
. . . . *
. P . . .
. P . F .
. P . . . 

. . . . A
. . . . *
. P . . .
. P . F .
. P . . . 

. . . . A
. . . . *
. P . . .
. P . F .
. P . . . 

. . . * A
. . . . *
. P . . .
. P . F .
. P . . . 

. . . * A
. . . . *
. P . . .
. P . F .
. P . . . 

. . * A .
. . . * .
. P . . .
. P . F .
. P . . . 

. * A . .
. . * . .
. P . . .
. P . F .
. P . . . 

. * A . .
. . * . .
. P . . .
. P . F .
. P . . . 

* A . . .
. * 

### Recolecao

In [24]:
ficheiro_controlador = "controladorAleatorio_recolecao.txt"
resetRecolecao(ficheiro_controlador,"simulação_recolecao_aleatorio.txt","agente_aleatorio_recolecao.txt","aleatorio",30)

In [25]:
controlador = criarControlador(ficheiro_controlador)
controlador.executa()

In [26]:
changeTest(ficheiro_controlador)
controlador = criarControlador(ficheiro_controlador)
controlador.executa()

A * . . .
* . O . .
. P . . .
. . . N .
. . . . .
A . . . .
* . O . .
. P . . .
. . . N .
. . . . . 

A . . . .
* . O . .
. P . . .
. . . N .
. . . . . 

A * . . .
* . O . .
. P . . .
. . . N .
. . . . . 

A * . . .
* . O . .
. P . . .
. . . N .
. . . . . 

A * . . .
* . O . .
. P . . .
. . . N .
. . . . . 

A . . . .
* . O . .
. P . . .
. . . N .
. . . . . 

. . . . .
A * O . .
* P . . .
. . . N .
. . . . . 

. . . . .
. . O . .
A * . . .
* . . N .
. . . . . 

. . . . .
* . O . .
A * . . .
. . . N .
. . . . . 

. . . . .
* . O . .
A * . . .
. . . N .
. . . . . 

* . . . .
A * O . .
. P . . .
. . . N .
. . . . . 

. * . . .
. A * . .
. * . . .
. . . N .
. . . . . 

* A * . .
. . O . .
. P . . .
. . . N .
. . . . . 

. . A * .
. . * . .
. P . . .
. . . N .
. . . . . 

. . . A *
. . O * .
. P . . .
. . . N .
. . . . . 

. . . . .
. . * A *
. P . * .
. . . N .
. . . . . 

. . * . .
. * A . .
. P * . .
. . . N .
. . . . . 

. . * . .
. . A * .
. P * . .
. . . N .
. . . . . 

. . . . .
. . 

## Teste da Política Fixa

### Farol

In [27]:
ficheiro_controlador = "controladorFixo_farol.txt"
resetFarol(ficheiro_controlador, "simulação_farol_fixo.txt", "agente_fixo_farol.txt", "fixo")
controlador = criarControlador(ficheiro_controlador)

In [28]:
controlador.executa()

In [29]:
changeTest(ficheiro_controlador)
controlador = criarControlador(ficheiro_controlador)
controlador.executa()

A * . . .
* . . . .
. P . . .
. P . F .
. P . . .
. . . . .
A * . . .
* P . . .
. P . F .
. P . . . 

. * . . .
. A * . .
. * . . .
. P . F .
. P . . . 

. . * . .
. . A * .
. P * . .
. P . F .
. P . . . 

. . . . .
. . . . .
. * A * .
. P * F .
. P . . . 

. . . . .
. . . . .
. P . . .
. * A * .
. P * . . 

. . . . .
. . . . .
. P . * .
. P . A *
. P . * . 



### Recolecao

In [30]:
ficheiro_controlador = "controladorFixo_recolecao.txt"
resetFarol(ficheiro_controlador, "simulação_recolecao_fixo.txt", "agente_fixo_recolecao.txt", "fixo")
controlador = criarControlador(ficheiro_controlador)

In [31]:
controlador.executa()

In [32]:
changeTest(ficheiro_controlador)
controlador = criarControlador(ficheiro_controlador)
controlador.executa()

A * . . .
* . . . .
. P . . .
. P . F .
. P . . .
. . . . .
A * . . .
* P . . .
. P . F .
. P . . . 

. * . . .
. A * . .
. * . . .
. P . F .
. P . . . 

. . * . .
. . A * .
. P * . .
. P . F .
. P . . . 

. . . . .
. . . . .
. * A * .
. P * F .
. P . . . 

. . . . .
. . . . .
. P . . .
. * A * .
. P * . . 

. . . . .
. . . . .
. P . * .
. P . A *
. P . * . 



## Teste do Algoritmo Genético

### Farol

In [33]:
from controlador import criarControlador

def resetFarolGenetico(ficheiro_controlador, ficheiro_simulacao, ficheiro_agente, politica,geracoes,num_individuos,taxa_mutacao,taxa_elite,novelty_weight,num_novelty,num_archives):
    texto_controlador = f"A\nF\n{politica}\n{geracoes}\n{num_individuos}\n{taxa_mutacao}\n{taxa_elite}\n{novelty_weight}\n{num_novelty}\n{num_archives}\nMS {ficheiro_simulacao}"
    texto_simulação = f"5\n50\nAG {ficheiro_agente}\n E farol (3,3) False False 100\nE parede (1,2) False True 0\nE parede (1,3) False True 0\nE parede (1,4) False True 0"
    texto_agente = "1\n(0,0)\n0\nS (0,-1) (0,1) (1,0)"

    with open(ficheiro_controlador, "w", encoding="utf-8") as f:
        f.write(texto_controlador)
    with open(ficheiro_simulacao, "w", encoding="utf-8") as f:
        f.write(texto_simulação)
    with open("agentes/" + ficheiro_agente, "w", encoding="utf-8") as f:
        f.write(texto_agente)


def changeTest(ficheiro_controlador):
    with open(ficheiro_controlador, "r", encoding="utf-8") as f:
        linhas = f.readlines()
    linhas[0] = "T\n"
    with open(ficheiro_controlador, "w", encoding="utf-8") as f:
        f.writelines(linhas)



In [34]:
GERACOES = 100
NUM_INDIVIDUOS = 200
TAXA_MUTACAO = 0.1
TAXA_ELITE = 0.2
NOVELTY_WEIGHT = 1000
NUMBER_NOVELTY = 5
NUMBER_ARCHIVES = 5

ficheiro_controlador = "controladorGenetico_farol.txt"
resetFarolGenetico(ficheiro_controlador, "simulação_farol_genetico.txt", "agente_genetico_farol.txt", "genetico",GERACOES,NUM_INDIVIDUOS,TAXA_MUTACAO,TAXA_ELITE,NOVELTY_WEIGHT,NUMBER_NOVELTY,NUMBER_ARCHIVES)
controlador = criarControlador(ficheiro_controlador)
controlador.executa()

Gen 1/100 | Avg Combined: -340.58 | Melhor fitness: 1000.00)
Gen 2/100 | Avg Combined: -204.37 | Melhor fitness: 466.67)
Gen 3/100 | Avg Combined: 75.58 | Melhor fitness: 766.67)
Gen 4/100 | Avg Combined: 281.96 | Melhor fitness: 666.67)
Gen 5/100 | Avg Combined: 349.00 | Melhor fitness: 566.67)
Gen 6/100 | Avg Combined: 371.12 | Melhor fitness: 566.67)
Gen 7/100 | Avg Combined: 358.58 | Melhor fitness: 566.67)
Gen 8/100 | Avg Combined: 352.38 | Melhor fitness: 566.67)
Gen 9/100 | Avg Combined: 362.29 | Melhor fitness: 566.67)
Gen 10/100 | Avg Combined: 368.96 | Melhor fitness: 566.67)
Gen 11/100 | Avg Combined: 359.12 | Melhor fitness: 566.67)
Gen 12/100 | Avg Combined: 384.75 | Melhor fitness: 566.67)
Gen 13/100 | Avg Combined: 347.71 | Melhor fitness: 566.67)
Gen 14/100 | Avg Combined: 367.54 | Melhor fitness: 566.67)
Gen 15/100 | Avg Combined: 342.75 | Melhor fitness: 500.00)
Gen 16/100 | Avg Combined: 322.50 | Melhor fitness: 500.00)
Gen 17/100 | Avg Combined: 298.25 | Melhor fitn

In [35]:
changeTest(ficheiro_controlador)
controlador = criarControlador(ficheiro_controlador)
controlador.executa()

A * . . .
* . . . .
. P . . .
. P . F .
. P . . .
A . . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A * . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A . . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A * . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A . . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A * . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A . . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A * . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A . . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A * . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A . . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A * . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A . . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A * . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A . . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A * . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A . . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A * . . .
* . . . .
. P . . .
. P . F .
. P . . . 

A . . . .
* . 

KeyboardInterrupt: 

### Recoleção

In [None]:
from controlador import criarControlador

def resetRecolecaoGenetico(ficheiro_controlador, ficheiro_simulacao, ficheiro_agente, politica, tempo,geracoes,num_individuos,taxa_mutacao,taxa_elite,novelty_weight,num_novelty,num_archives):
    texto_controlador = f"A\nR {tempo}\n{politica}\n{geracoes}\n{num_individuos}\n{taxa_mutacao}\n{taxa_elite}\n{novelty_weight}\n{num_novelty}\n{num_archives}\nMS {ficheiro_simulacao}"
    texto_simulação = f"5\n50\nAG {ficheiro_agente}\nE ninho (3,3) False False 0\nE parede (1,2) False True 0\nE ovo (2,1) True False 10"
    texto_agente = "1\n(0,0)\n0\nS (0,-1) (0,1) (1,0)"

    with open(ficheiro_controlador, "w", encoding="utf-8") as f:
        f.write(texto_controlador)
    with open(ficheiro_simulacao, "w", encoding="utf-8") as f:
        f.write(texto_simulação)
    with open("agentes/" + ficheiro_agente, "w", encoding="utf-8") as f:
        f.write(texto_agente)

In [None]:
GERACOES = 100
NUM_INDIVIDUOS = 200
TAXA_MUTACAO = 0.1
TAXA_ELITE = 0.2
NOVELTY_WEIGHT = 1000
NUMBER_NOVELTY = 5
NUMBER_ARCHIVES = 5

ficheiro_controlador = "controladorGenetico_recolecao.txt"
resetRecolecaoGenetico(ficheiro_controlador, "simulação_recolecao_genetico.txt", "agente_genetico_recolecao.txt", "genetico", 30,GERACOES,NUM_INDIVIDUOS,TAXA_MUTACAO,TAXA_ELITE,NOVELTY_WEIGHT,NUMBER_NOVELTY,NUMBER_ARCHIVES)
controlador = criarControlador(ficheiro_controlador)
controlador.executa()

In [None]:
changeTest(ficheiro_controlador)
controlador = criarControlador(ficheiro_controlador)
controlador.executa()

## Teste Algoritmo Reforço

### Farol

In [None]:
def resetFarolReforco(ficheiro_controlador, ficheiro_simulacao, ficheiro_agente, politica,episodios,alpha,gama,eps_inicial,eps_final):
    texto_controlador = f"A\nF\n{politica}\n{episodios}\nMS {ficheiro_simulacao}"
    texto_simulação = f"5\n50\nAG {ficheiro_agente}\n E farol (3,3) False False 100\nE parede (1,2) False True 0\nE parede (1,3) False True 0\nE parede (1,4) False True 0"
    texto_agente = f"1\n(0,0)\n0\nS (0,-1) (0,1) (1,0)\n{alpha}\n{gama}\n{eps_inicial}\n{eps_final}"

    with open(ficheiro_controlador, "w", encoding="utf-8") as f:
        f.write(texto_controlador)
    with open(ficheiro_simulacao, "w", encoding="utf-8") as f:
        f.write(texto_simulação)
    with open("agentes/" + ficheiro_agente, "w", encoding="utf-8") as f:
        f.write(texto_agente)


def changeTest(ficheiro_controlador):
    with open(ficheiro_controlador, "r", encoding="utf-8") as f:
        linhas = f.readlines()
    linhas[0] = "T\n"
    with open(ficheiro_controlador, "w", encoding="utf-8") as f:
        f.writelines(linhas)


In [None]:
EPISODIOS = 10000
ALPHA = 0.4
GAMA = 0.99
EPS_INICIAL = 1
EPS_FINAL = 0.05

ficheiro_controlador = "controladorReforco_farol.txt"
resetFarolReforco(ficheiro_controlador, "simulação_farol_reforco.txt", "agente_reforco_farol.txt", "reforco",
                  EPISODIOS,ALPHA,GAMA,EPS_INICIAL,EPS_FINAL)
controlador = criarControlador(ficheiro_controlador)
controlador.executa()

In [None]:
changeTest(ficheiro_controlador)
controlador = criarControlador(ficheiro_controlador)
controlador.executa()

### Recolecao

In [None]:
def resetRecolecaoReforco(ficheiro_controlador, ficheiro_simulacao, ficheiro_agente, politica,tempo,episodios,alpha,gama,eps_inicial,eps_final):
    texto_controlador = f"A\nR {tempo}\n{politica}\n{episodios}\nMS {ficheiro_simulacao}"
    texto_simulação = f"5\n50\nAG {ficheiro_agente}\nE ninho (3,3) False False 0\nE parede (1,2) False True 0\nE ovo (2,1) True False 10"
    texto_agente = f"1\n(0,0)\n0\nS (0,-1) (0,1) (1,0)\n{alpha}\n{gama}\n{eps_inicial}\n{eps_final}"

    with open(ficheiro_controlador, "w", encoding="utf-8") as f:
        f.write(texto_controlador)
    with open(ficheiro_simulacao, "w", encoding="utf-8") as f:
        f.write(texto_simulação)
    with open("agentes/" + ficheiro_agente, "w", encoding="utf-8") as f:
        f.write(texto_agente)

In [None]:
EPISODIOS = 10000
ALPHA = 0.4
GAMA = 0.99
EPS_INICIAL = 1
EPS_FINAL = 0.05

ficheiro_controlador = "controladorReforco_recolecao.txt"
resetRecolecaoReforco(ficheiro_controlador, "simulação_recolecao_reforco.txt", "agente_reforco_recolecao.txt", "reforco",30,
                  EPISODIOS, ALPHA, GAMA, EPS_INICIAL, EPS_FINAL)
controlador = criarControlador(ficheiro_controlador)
controlador.executa()

In [None]:
changeTest(ficheiro_controlador)
controlador = criarControlador(ficheiro_controlador)
controlador.executa()