Problema das caixas não-binárias
================================



## Objetivo



Encontrar uma solução para o problema das caixas não-binárias usando um algoritmo genético. Considere 4 caixas. Considere que cada caixa pode ter um valor inteiro dentro do conjunto [0, 100].



## Descrição do problema



O problema das caixas não-binárias é simples: nós temos um certo número de caixas e cada uma pode conter um número inteiro. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Importações



In [1]:
from funcoes import populacao_cnb
from funcoes import funcao_objetivo_pop_cnb as funcao_objetivo_pop
from funcoes import selecao_roleta_max as funcao_selecao
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_cnb
import random

## Códigos e discussão



O problema das caixas não binárias continua tendo por objetivo encontrar a combinação onde a soma dos valores contidos nos genes é máxima, mudando apenas que cada um dos genes pode ser não apenas 0 e 1, mas qualquer inteiro entre 0 e 100. 

Dado, então, que experimento a ser realizado nesse notebook é bem semelhante ao experimento anterior, foram importados os mesmos conjuntos funções e determinados os mesmos tipos de constantes, tendo sido acrescentada apenas a constante `VALOR_MAX_CAIXA`, que indica o valor máximo que o gene pode assumir, nesse caso 100.

In [2]:
# constantes de busca

# pode mudar para melhorar a eficácia do algoritmo construído
TAMANHO_POP = 10
NUM_GERACOES = 200
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.07



# constantes do problema

# se forem alteradas, alteramos consequentemente o problema
# que está sendo resolvido
NUM_GENES = 4
VALOR_MAX_CAIXA = 100

In [3]:
# funções locais 
# no caso desse notebook elas foram utilizadas p modificar e dar
# valor padrão para algumas funções definidas no funcoes.py
# também podem ser chamadas de "funções parciais"

def cria_populacao_inicial(tamanho, n_genes):
    return populacao_cnb(tamanho, n_genes, VALOR_MAX_CAIXA)

def funcao_mutacao(individuo):
    return mutacao_cnb(individuo, VALOR_MAX_CAIXA)

Foram criadas também funções locais, as funções locais são funções definidas no arquivo `funcoes.py` só que com valores definidos para alguns dos argumentos, nesse caso o valor máximo igual a 100

In [4]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

print("População inicial:")
print(populacao)

for n in range(NUM_GERACOES):
    
    # para selecionar
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    # para cruzamento
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1]  = filho2
            
        contador = contador + 2
        
    # para mutação
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)
            
print()
print("População final:")
print(populacao)

População inicial:
[[27, 37, 40, 2], [15, 28, 42, 8], [43, 9, 74, 28], [71, 45, 65, 66], [92, 17, 20, 82], [79, 81, 89, 12], [36, 98, 84, 75], [92, 9, 7, 52], [2, 36, 70, 24], [57, 42, 95, 12]]

População final:
[[52, 92, 80, 85], [52, 92, 83, 85], [52, 92, 83, 85], [63, 92, 83, 85], [52, 92, 83, 85], [52, 92, 83, 85], [52, 92, 80, 85], [63, 92, 83, 85], [63, 0, 83, 85], [52, 92, 80, 85]]


## Conclusão



Dessa forma, com o código implementado, podemos dizer que o objetivo de procurar a maior soma possível para os genes de um indivíduo foi bem-sucedido, pois a população gerada ao final já se encontra bem mais próxima dessa resposta ideal do que no início, como mostrado acima.

Nesse experimento não houve grandes mudanças a respeito da lógica e da implementação quando comparado ao problema das caixas binárias. No entanto, ao aumentarmos a faixa de possibilidades para os valores que os genes podem assumir, aumentamos também o espaço de busca, fazendo com que seja mais difícil de o problema convergir.

Para tentar contornar um pouco disso, os valores das constantes foram alterados com relação ao experimento A.03 como o `TAMANHO_POP`, já que um população inicial maior pode significar maior variabilidade genética desde o início; o `NUM_GERACOES`, já que um número maior de gerações permite um "maior tempo" de seleção o que pode indicar mais chances de aperfeiçoamento e `CHANCE_MUTACAO` aumentando um pouquinho  a mais a variabilidade genética.

De fato, como imaginava, as funções criadas nos primeiros experimentos podem e estão sendo muito bem reaproveitadas mesmo para resolver diferentes problemas e estou curiosa para saber como se encaixarão nos próximos &#x1F604;.

## Playground

