Algoritmo genético
==================



## Introdução



`Algoritmos genéticos` são algoritmos inspirados na teoria da evolução de Darwin e são ferramentas poderosas para resolver problemas de otimização. De maneira simples, a estratégia consiste em gerar uma população inicial aleatória e através de seleção, cruzamento e mutação sucessivas, gerar populações seguintes. Se feito de maneira correta, as populações seguintes tendem a ser melhores candidatos para a solução do problema do que as populações anteriores.

Um algoritmo genético pode parecer um tanto complexo, porém é possível dividi-lo em partes relativamente simples:

1.  Criação da população inicial (aleatória)

2.  Cálculo da função objetivo para todos os membros da população inicial e atualização do hall da fama

3.  Seleção dos indivíduos (quais seguem pra próxima geração)

4.  Cruzamento dos indivíduos selecionados (troca de material genético)

5.  Mutação dos indivíduos da população recém-criada (possibilidade de trazer informação nova ao sistema)

6.  Cálculo da função objetivo para todos os membros da população recém-criada e atualização do hall da fama

7.  Checar os critérios de parada. Caso os critérios não tenham sido atendidos, retornar ao passo 3

8.  Retornar para o usuário o hall da fama



## Glossário



-   `Indivíduo`: um candidato para a solução do problema

-   `População`: um conjunto de candidatos para a solução do problema

-   `Gene`: um parâmetro que pertence a um indivíduo

-   `Cromossomo` ou `genótipo`: um conjunto de genes

-   `Geração`: cada população em uma busca genética faz parte de uma geração. A primeira geração é geralmente formada por indivíduos aleatórios (sorteados dentro do espaço de busca). As gerações seguintes são formadas por seleção, cruzamento e mutação da geração anterior. Um dos critérios de parada possíveis para um algoritmo genético é o número máximo de gerações

-   `Função de aptidão` ou `função objetivo` ou `função fitness`: uma função que recebe um indivíduo e retorna o seu valor de aptidão. Em um problema de otimização, nós buscamos encontrar soluções que minimizam ou maximizam o valor de aptidão

-   `Seleção`: processo onde utilizamos o valor de aptidão dos indivíduos para selecionar quais irão passar seus genes para a geração seguinte

-   `Cruzamento`: processo onde o material genético de indivíduos selecionados é misturado

-   `Mutação`: processo onde os genes dos indivíduos selecionados têm uma chance de alterar seu valor. A mutação é o único processo capaz de introduzir informação nova ao pool genético após o sorteio aleatório da primeira geração

-   `Hall da fama`: conjunto dos $n$ indivíduos que obtiveram os melhores valores de aptidão durante o processo de busca



## Reflexões



Você diria que o algoritmo genético é determinístico ou probabilístico?

Será que um algoritmo genético é capaz de encontrar mínimos (ou máximos) da função objetivo?

O que será que acontece quando não realizamos a etapa de mutação do algoritmo genético?

O que será que acontece quando usamos uma chance de mutação muito alta?



## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo genético. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Importações



In [1]:
# importando as funções a serem usadas na resolução do problema
from funcoes import populacao_cb as cria_populacao_inicial
from funcoes import funcao_objetivo_pop_cb as funcao_objetivo_pop
from funcoes import selecao_roleta_max as funcao_selecao
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_cb as funcao_mutacao
import random

## Códigos e discussão



In [2]:
#constantes

Tamanho_pop = 6 #tamanho da população
Num_genes = 4 #número de genes
Num_geracoes = 5 #número de gerações
chance_cruzamento = 0.5 #porcentagem de chance de um cruzamento acontecer
chance_mutacao = 0.05 #porcentagem de chance de haver mutação na população

Na célula acima, estão sendo definidas as constantes a serem utilizadas na resolução do problema. Nela, é definido o tamnho da população (quanridade de indivíduos), o número de genes (quantidade de genes presentes em cada indivíduo - quantidade de "zeros e uns"), número de gerações ("renovação da população"), a chance de cruzamento (quantos por cento tem de chance de um indivíduo cruzar com outro) e a chance de mutação (a probabilidade de um gene ser trocado por outro - trocar um "zero" por "um").

In [3]:
populacao = cria_populacao_inicial(Tamanho_pop, Num_genes) #cria uma população inicial aleatória com 6 indivíduos

print("População inicial: ")
print(populacao)

for n in range(Num_geracoes): 
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao (populacao, fitness) #seleciona indivíduos para passarem por, possivelmente, cruzamento, mutação ou direto a próxima geração.
    pais = populacao[0::2] # indivíduos pares
    maes = populacao[1::2] # indivíduos ímpares
    contador = 0
    for pai, mae in zip(pais, maes): # chance de pai e mãe cruzarem
        if random.random() < chance_cruzamento: 
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador] = filho2
            #ocorre cruzamento
            
        contador = contador + 2

        for n in range(len(populacao)): #chance de mutação para cada indivíduo
            if random.random() <= chance_mutacao:
                individuo = populacao[n]
                print()
                print(individuo)
                populacao[n] = funcao_mutacao(individuo)
                print(populacao[n])
                print()
print()
print("População final: ")
print(populacao)

População inicial: 
[[0, 1, 0, 0], [1, 0, 0, 0], [1, 1, 0, 0], [1, 1, 0, 0], [1, 0, 1, 0], [0, 0, 0, 0]]

[1, 1, 1, 0]
[1, 1, 1, 0]


[1, 1, 0, 0]
[1, 1, 0, 1]


[1, 1, 0, 0]
[1, 0, 0, 0]


[1, 1, 1, 0]
[1, 1, 1, 1]


[1, 1, 1, 1]
[1, 1, 1, 1]


[1, 1, 0, 0]
[1, 1, 0, 0]


População final: 
[[1, 1, 0, 0], [1, 0, 0, 0], [1, 0, 1, 0], [1, 0, 0, 0], [1, 1, 1, 0], [1, 1, 1, 1]]


O primeiro passo tomado nessa célula é a criação de uma população, no caso com 6 indivíduos. Sendo isso, dentro da população formada, são feitas as probabilidades dos indivíduos cruzarem, mutarem e passarem para a próxima geração. Por fim, faz-se a função que executa propriamente a mutação. Por fim, é retornada a melhor população final encontrada.

In [4]:
#constantes
#testando o que acontece se aumentarmos o tamanho da população e o número de gerações

Tamanho_pop2 = 150
Num_genes2 = 4
Num_geracoes2 = 10
chance_cruzamento2 = 0.5

In [5]:
populacao = cria_populacao_inicial(Tamanho_pop2, Num_genes2)

print("População inicial: ")
print(populacao)

for n in range(Num_geracoes2):
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao (populacao, fitness)
    pais = populacao[0::2]
    maes = populacao[1::2]
    contador = 0
    for pai, mae in zip(pais, maes):
        if random.random() < chance_cruzamento2:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador] = filho2
            #ocorre cruzamento
            
        contador = contador + 2

    
   
print()
print("População final: ")
print(populacao)

População inicial: 
[[1, 0, 0, 0], [0, 1, 1, 1], [0, 1, 0, 1], [0, 1, 0, 0], [1, 0, 1, 0], [0, 0, 0, 1], [0, 1, 1, 0], [1, 1, 1, 0], [1, 0, 0, 1], [1, 0, 0, 0], [1, 1, 1, 0], [1, 0, 1, 1], [1, 0, 0, 0], [0, 0, 1, 1], [0, 0, 0, 1], [1, 1, 1, 0], [0, 0, 0, 1], [1, 0, 0, 1], [1, 0, 1, 1], [1, 1, 1, 1], [1, 1, 0, 1], [0, 1, 0, 1], [1, 1, 1, 0], [1, 0, 0, 1], [0, 1, 1, 0], [0, 1, 0, 1], [0, 0, 1, 1], [0, 0, 0, 0], [1, 0, 1, 1], [1, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0], [1, 0, 1, 1], [0, 0, 1, 1], [0, 0, 0, 1], [0, 1, 0, 0], [1, 1, 1, 1], [1, 0, 1, 1], [1, 1, 0, 0], [1, 1, 1, 1], [0, 1, 1, 1], [0, 1, 0, 1], [0, 1, 0, 0], [0, 0, 0, 0], [0, 1, 0, 0], [1, 1, 1, 0], [0, 0, 0, 1], [1, 0, 0, 1], [1, 1, 0, 0], [0, 1, 1, 1], [0, 0, 1, 1], [1, 0, 1, 1], [1, 0, 1, 0], [1, 0, 1, 0], [0, 1, 0, 0], [1, 1, 0, 0], [0, 1, 1, 1], [1, 0, 1, 0], [1, 1, 0, 1], [0, 1, 1, 0], [0, 0, 1, 0], [0, 1, 1, 0], [0, 0, 1, 0], [0, 0, 1, 1], [1, 1, 0, 0], [1, 0, 1, 0], [0, 1, 1, 1], [0, 0, 0, 1], [1, 0, 0, 1],

In [6]:
#taxa de mutação muito alta

#constantes

Tamanho_pop3 = 6 #tamanho da população
Num_genes3 = 4 #número de genes
Num_geracoes3 = 5 #número de gerações
chance_cruzamento3 = 0.5 #porcentagem de chance de um cruzamento acontecer
chance_mutacao3 = 0.5 #porcentagem de chance de haver mutação na população

In [7]:
populacao = cria_populacao_inicial(Tamanho_pop3, Num_genes3)

print("População inicial: ")
print(populacao)

for n in range(Num_geracoes3):
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao (populacao, fitness)
    pais = populacao[0::2]
    maes = populacao[1::2]
    contador = 0
    for pai, mae in zip(pais, maes):
        if random.random() < chance_cruzamento3:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador] = filho2
            #ocorre cruzamento
            
        contador = contador + 2
        
        for n in range(len(populacao)):
            if random.random() <= chance_mutacao3:
                individuo = populacao[n]
                print()
                print(individuo)
                populacao[n] = funcao_mutacao(individuo)
                print(populacao[n])
                print()

    
   
print()
print("População final: ")
print(populacao)

População inicial: 
[[1, 1, 0, 0], [1, 0, 0, 1], [0, 0, 1, 1], [1, 0, 0, 0], [1, 1, 1, 0], [1, 1, 0, 1]]

[1, 0, 0, 1]
[1, 0, 0, 1]


[1, 0, 0, 0]
[0, 0, 0, 0]


[1, 1, 0, 0]
[1, 0, 0, 0]


[1, 1, 1, 0]
[1, 1, 1, 0]


[1, 1, 1, 0]
[1, 1, 1, 0]


[0, 0, 0, 0]
[0, 0, 0, 0]


[1, 1, 1, 0]
[0, 1, 1, 0]


[0, 1, 1, 0]
[0, 1, 1, 0]


[0, 1, 1, 0]
[0, 1, 1, 0]


[0, 1, 1, 0]
[1, 1, 1, 0]


[1, 0, 0, 1]
[1, 0, 0, 0]


[1, 1, 1, 0]
[1, 1, 1, 0]


[1, 0, 0, 0]
[0, 0, 0, 0]


[1, 1, 1, 0]
[1, 1, 1, 0]


[0, 0, 0, 0]
[0, 0, 0, 0]


[1, 0, 1, 0]
[1, 0, 1, 0]


[0, 0, 0, 0]
[0, 0, 0, 0]


[1, 1, 1, 0]
[1, 0, 1, 0]


[1, 0, 1, 0]
[1, 0, 1, 0]


[0, 0, 0, 0]
[0, 1, 0, 0]


[0, 1, 0, 0]
[1, 1, 0, 0]


[1, 0, 1, 0]
[1, 0, 1, 0]


[1, 0, 1, 0]
[1, 0, 1, 0]


[1, 0, 1, 0]
[1, 0, 1, 0]


[1, 0, 1, 0]
[1, 0, 1, 0]


[1, 0, 1, 0]
[1, 0, 1, 0]


[1, 0, 1, 0]
[1, 0, 1, 0]


[1, 0, 1, 0]
[1, 0, 1, 0]


[1, 0, 1, 0]
[1, 0, 1, 0]


[1, 0, 1, 0]
[1, 0, 1, 0]


[1, 0, 1, 0]
[1, 0, 1, 0]


[1, 0, 1, 0]
[1, 0, 1, 0]


## Conclusão



O algoritmo genético, que trata da combinação de indivíduos, havendo mutação e cruzamento, apresenta características probabilísticas, uma vez que faz diversas combinações aleatórias entre os indivíduos, de modo a encontrar o conjunto de indivíduos que melhor se encaixe no problema apresentado. Com esse algoritmo, é possível determinar máximos e mínimos de funções, iterando várias partes do processo, chegando cada vez mais próximo desses valores de máximo e mínimo. Caso não haja mutação, a variabilidade genética será muito baixa, o que, caso a população não esteja em um ambiente minimamente favorável para si, levará essa a extinção, uma vez que não será capaz de se adaptar suficientemente rápido ao ambiente em que vive. Tal qual quando não há mutação, uma alta taxa de mutação também é prejudicial para a população. A alta variabilidade genética leva a população a não convergir para um ponto comum, causando a dispersão da mesma.

## Playground

