Algoritmo genético
==================



## Introdução



`Algoritmos genéticos` são algoritmos inspirados na teoria da evolução de Darwin e são ferramentas poderosas para resolver problemas de otimização. De maneira simples, a estratégia consiste em gerar uma população inicial aleatória e através de seleção, cruzamento e mutação sucessivas, gerar populações seguintes. Se feito de maneira correta, as populações seguintes tendem a ser melhores candidatos para a solução do problema do que as populações anteriores.

Um algoritmo genético pode parecer um tanto complexo, porém é possível dividi-lo em partes relativamente simples:

1.  Criação da população inicial (aleatória)

2.  Cálculo da função objetivo para todos os membros da população inicial e atualização do hall da fama

3.  Seleção dos indivíduos (quais seguem pra próxima geração)

4.  Cruzamento dos indivíduos selecionados (troca de material genético)

5.  Mutação dos indivíduos da população recém-criada (possibilidade de trazer informação nova ao sistema)

6.  Cálculo da função objetivo para todos os membros da população recém-criada e atualização do hall da fama

7.  Checar os critérios de parada. Caso os critérios não tenham sido atendidos, retornar ao passo 3

8.  Retornar para o usuário o hall da fama



## Glossário



-   `Indivíduo`: um candidato para a solução do problema

-   `População`: um conjunto de candidatos para a solução do problema

-   `Gene`: um parâmetro que pertence a um indivíduo

-   `Cromossomo` ou `genótipo`: um conjunto de genes

-   `Geração`: cada população em uma busca genética faz parte de uma geração. A primeira geração é geralmente formada por indivíduos aleatórios (sorteados dentro do espaço de busca). As gerações seguintes são formadas por seleção, cruzamento e mutação da geração anterior. Um dos critérios de parada possíveis para um algoritmo genético é o número máximo de gerações

-   `Função de aptidão` ou `função objetivo` ou `função fitness`: uma função que recebe um indivíduo e retorna o seu valor de aptidão. Em um problema de otimização, nós buscamos encontrar soluções que minimizam ou maximizam o valor de aptidão

-   `Seleção`: processo onde utilizamos o valor de aptidão dos indivíduos para selecionar quais irão passar seus genes para a geração seguinte

-   `Cruzamento`: processo onde o material genético de indivíduos selecionados é misturado

-   `Mutação`: processo onde os genes dos indivíduos selecionados têm uma chance de alterar seu valor. A mutação é o único processo capaz de introduzir informação nova ao pool genético após o sorteio aleatório da primeira geração

-   `Hall da fama`: conjunto dos $n$ indivíduos que obtiveram os melhores valores de aptidão durante o processo de busca



## Reflexões



Você diria que o algoritmo genético é determinístico ou probabilístico?

Será que um algoritmo genético é capaz de encontrar mínimos (ou máximos) da função objetivo?

O que será que acontece quando não realizamos a etapa de mutação do algoritmo genético?

O que será que acontece quando usamos uma chance de mutação muito alta?



## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo genético. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Importações



In [1]:
from funcoes import funcao_objetivo_pop as f_ob
from funcoes import n_populacao as num_pop
from funcoes import selecao_max as selecao
from funcoes import cruzamento
from funcoes import mutacao
import random

## Códigos e discussão



Vou reutilizar as funções definidas para os experimentos anteriores para gerar um indívuo, atribuir genes binário a eles e calcular a função objetivo:
> gene_cb, indv, funcao_objetivo

Porém agora, com o desafio adicional da seleção, cruzamento e mutação, foi preciso desenvolver funções correspondentes para essas tarefas e armazená-las na biblioteca <b>funcoes.py</b>. São elas:
> <b>funcao_objetivo_pop</b>(<b>f_ob</b>), <b>n_populacao </b>(<b>num_pop</b>), <b>selecao_max </b>(<b>selecao</b>), <b>cruzamento</b> e <b>mutacao</b>

Assim, entre o geração e a seleção temos:

In [16]:
tamanho = 10
genes = 4
geracoes = 30
chance_cruzamento = 0.5
chance_mutacao = 0

In [17]:
populacao = num_pop(tamanho, genes) # vai gerar a população com genes aleatórios
print(f"População inicial: {populacao}")

População inicial: [[0, 0, 0, 1], [1, 0, 0, 1], [0, 1, 1, 0], [1, 0, 1, 1], [0, 0, 1, 1], [1, 0, 1, 1], [1, 1, 0, 0], [1, 1, 1, 1], [1, 0, 1, 0], [1, 1, 1, 1]]


In [20]:
for n in range(geracoes): # para cada geração, o fit da população é avaliado
    fitness = f_ob(populacao)
    populacao = selecao(populacao, fitness) # e a população é selecionada a partir desse fit
    
    pais = populacao[::2] # os pais serão selecionados de 2 em 2 indivíduos
    maes = populacao[1::2] # e as mães também, mas iniciando na segunda posição
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() < chance_cruzamento:
            filho1, filho2 = cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        contador = contador + 2
    
    for n in range(len(populacao)):
        if random.random() <= chance_mutacao:
            individuo = populacao[n]
            print()
            print(individuo)
            populacao[n] = mutacao(individuo)
            print(populacao[n])

In [21]:
print(f"População final: {populacao}")

População final: [[1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 1, 1]]


## Conclusão



A dinâmica populacional do algoritmo genético possui valores inicialmente aleatórios e com base neles busca a combinação mais adequada. Esse algoritmo avalia as interações, gerações e mutações desses valores e retorna os candidatos mais bem sucedidos ao final dessas medições, mas, dependendo da escala do modelo, é impraticável analisar todas as possíveis combinações. Como o algoritmo faz uma simulação entre grupos ou pares de candidatos para "medir fitness", mas não um "scan" avaliador por todas as possibilidades, ele é probabilístico.

---

Sem a mutação o modelo demoraria mais a encontrar uma solução satisfatória ou poderia ser impossibilitado de chegar na pontuação máxima (pois nenhuma combinação linear poderia "mudar a base" do sistema, adicionando um valor sem precedentes). Por "arriscar pouco", ficaria excessivamente dependente da variabilidade genética inicial. Por outro lado, uma chance de mutação muito alta poderia trazer de volta uma alta aleatoriedade para a subpopulação selecionada. O mais seguro poderia ser uma chance de mutação em que o material genético passado adiante seja coerente com o dos progenitores desse novo indivíduo, pois, afinal, eles forem escolhidos por seu melhor <i>fit</i>, mas que ainda exista a chance de experimentarem combinações de valores inéditas para o modelo.

## Playground

