Algoritmo genético
==================



## Introdução



`Algoritmos genéticos` são algoritmos inspirados na teoria da evolução de Darwin e são ferramentas poderosas para resolver problemas de otimização. De maneira simples, a estratégia consiste em gerar uma população inicial aleatória e através de seleção, cruzamento e mutação sucessivas, gerar populações seguintes. Se feito de maneira correta, as populações seguintes tendem a ser melhores candidatos para a solução do problema do que as populações anteriores.

Um algoritmo genético pode parecer um tanto complexo, porém é possível dividi-lo em partes relativamente simples:

1.  Criação da população inicial (aleatória)

2.  Cálculo da função objetivo para todos os membros da população inicial e atualização do hall da fama

3.  Seleção dos indivíduos (quais seguem pra próxima geração)

4.  Cruzamento dos indivíduos selecionados (troca de material genético)

5.  Mutação dos indivíduos da população recém-criada (possibilidade de trazer informação nova ao sistema)

6.  Cálculo da função objetivo para todos os membros da população recém-criada e atualização do hall da fama

7.  Checar os critérios de parada. Caso os critérios não tenham sido atendidos, retornar ao passo 3

8.  Retornar para o usuário o hall da fama



## Glossário



-   `Indivíduo`: um candidato para a solução do problema

-   `População`: um conjunto de candidatos para a solução do problema

-   `Gene`: um parâmetro que pertence a um indivíduo

-   `Cromossomo` ou `genótipo`: um conjunto de genes

-   `Geração`: cada população em uma busca genética faz parte de uma geração. A primeira geração é geralmente formada por indivíduos aleatórios (sorteados dentro do espaço de busca). As gerações seguintes são formadas por seleção, cruzamento e mutação da geração anterior. Um dos critérios de parada possíveis para um algoritmo genético é o número máximo de gerações

-   `Função de aptidão` ou `função objetivo` ou `função fitness`: uma função que recebe um indivíduo e retorna o seu valor de aptidão. Em um problema de otimização, nós buscamos encontrar soluções que minimizam ou maximizam o valor de aptidão

-   `Seleção`: processo onde utilizamos o valor de aptidão dos indivíduos para selecionar quais irão passar seus genes para a geração seguinte

-   `Cruzamento`: processo onde o material genético de indivíduos selecionados é misturado

-   `Mutação`: processo onde os genes dos indivíduos selecionados têm uma chance de alterar seu valor. A mutação é o único processo capaz de introduzir informação nova ao pool genético após o sorteio aleatório da primeira geração

-   `Hall da fama`: conjunto dos $n$ indivíduos que obtiveram os melhores valores de aptidão durante o processo de busca



## Reflexões



Você diria que o algoritmo genético é determinístico ou probabilístico?

Será que um algoritmo genético é capaz de encontrar mínimos (ou máximos) da função objetivo?

O que será que acontece quando não realizamos a etapa de mutação do algoritmo genético?

O que será que acontece quando usamos uma chance de mutação muito alta?



## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo genético. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Importações



In [1]:
import random
from funcoes import população_cb as criaPopulaçãoInicial
from funcoes import seleçãoRoletaMax as funçãoSeleção
from funcoes import funçãoObjetivoPopulação_cb as funçãoObjetivoPopulação
from funcoes import cruzamentoPontoSimples as funçãoCruzamento
from funcoes import mutação_cb as funçãoMutação

## Códigos e discussão



In [2]:
# Constantes:

TAMANHO_POP = 6
NUM_GENES = 4
NUM_GERAÇÕES = 10
CHANCE_CRUZAMENTO = 0.75
CHANCE_MUTAÇÃO = 0.05

In [3]:
# Script:

população = criaPopulaçãoInicial(TAMANHO_POP, NUM_GENES)

print("População inicial:")
print(população)

for _ in range(NUM_GERAÇÕES):
    # --- SELEÇÃO:
    fitness = funçãoObjetivoPopulação(população)
    população = funçãoSeleção(população, fitness)

    # --- CRUZAMENTO:
    pais = população[0::2]
    mães = população[1::2]
    contador = 0
    
    for pai, mãe in zip(pais, mães):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funçãoCruzamento(pai, mãe)
            população[contador] = filho1
            população[contador+1] = filho2
        contador += 2

    # --- MUTAÇÃO:
    for indivíduo in população:
        if random.random() <= CHANCE_MUTAÇÃO:
            print()
            print('Mutação!')
            print(indivíduo)

            indivíduo = funçãoMutação(indivíduo)

            print(indivíduo)

print()
print("População final:")
print(população)

População inicial:
[[0, 0, 0, 1], [0, 0, 0, 0], [0, 0, 1, 1], [0, 1, 0, 1], [1, 1, 0, 0], [0, 0, 1, 1]]

Mutação!
[0, 1, 0, 1]
[0, 1, 1, 1]

Mutação!
[0, 1, 1, 1]
[0, 1, 0, 1]

População final:
[[0, 1, 1, 1], [0, 1, 1, 1], [0, 1, 1, 1], [0, 1, 1, 1], [0, 1, 0, 1], [0, 1, 1, 1]]


## Conclusão

O algoritmo genético implementado acima é probabilístico - afinal, apesar de possuir uma base concreta que não muda a cada iteração, diversos operadores dependem de números gerados aleatoriamente. Por esse motivo, como discutido em sala de aula, ele não é completamente reprodutível.

Mesmo assim, um algoritmo genético é perfeitamente capaz de encontrar mínimos ou máximos da sua função objetivo atribuída - considerando a necessidade de um número maior de gerações e outros parâmetros para um resultado melhor. Vale também levar em conta a importância do fator probabilístico deste algoritmo (a "sorte" possui um papel essencial no resultado também: desde a população inicial até a seleção, cruzamento e mutação).

Outro ponto importante é o da regulagem de cada parâmetro; a mutação, por exemplo, não pode ocorrer muito frequentemente, correndo o risco de afetar negativamente a otimização da população realizada pela seleção e pelo cruzamento. Por outro lado, sem a mutação, a população pode se encontrar estagnada em um resultado não ideal pela ausência de um determinado material genético relevante para a solução na população inicial.

## Playground

