Algoritmo genético
==================



## Introdução



`Algoritmos genéticos` são algoritmos inspirados na teoria da evolução de Darwin e são ferramentas poderosas para resolver problemas de otimização. De maneira simples, a estratégia consiste em gerar uma população inicial aleatória e através de seleção, cruzamento e mutação sucessivas, gerar populações seguintes. Se feito de maneira correta, as populações seguintes tendem a ser melhores candidatos para a solução do problema do que as populações anteriores.

Um algoritmo genético pode parecer um tanto complexo, porém é possível dividi-lo em partes relativamente simples:

1.  Criação da população inicial (aleatória)

2.  Cálculo da função objetivo para todos os membros da população inicial e atualização do hall da fama

3.  Seleção dos indivíduos (quais seguem pra próxima geração)

4.  Cruzamento dos indivíduos selecionados (troca de material genético)

5.  Mutação dos indivíduos da população recém-criada (possibilidade de trazer informação nova ao sistema)

6.  Cálculo da função objetivo para todos os membros da população recém-criada e atualização do hall da fama

7.  Checar os critérios de parada. Caso os critérios não tenham sido atendidos, retornar ao passo 3

8.  Retornar para o usuário o hall da fama



## Glossário



-   `Indivíduo`: um candidato para a solução do problema

-   `População`: um conjunto de candidatos para a solução do problema

-   `Gene`: um parâmetro que pertence a um indivíduo

-   `Cromossomo` ou `genótipo`: um conjunto de genes

-   `Geração`: cada população em uma busca genética faz parte de uma geração. A primeira geração é geralmente formada por indivíduos aleatórios (sorteados dentro do espaço de busca). As gerações seguintes são formadas por seleção, cruzamento e mutação da geração anterior. Um dos critérios de parada possíveis para um algoritmo genético é o número máximo de gerações

-   `Função de aptidão` ou `função objetivo` ou `função fitness`: uma função que recebe um indivíduo e retorna o seu valor de aptidão. Em um problema de otimização, nós buscamos encontrar soluções que minimizam ou maximizam o valor de aptidão

-   `Seleção`: processo onde utilizamos o valor de aptidão dos indivíduos para selecionar quais irão passar seus genes para a geração seguinte

-   `Cruzamento`: processo onde o material genético de indivíduos selecionados é misturado

-   `Mutação`: processo onde os genes dos indivíduos selecionados têm uma chance de alterar seu valor. A mutação é o único processo capaz de introduzir informação nova ao pool genético após o sorteio aleatório da primeira geração

-   `Hall da fama`: conjunto dos $n$ indivíduos que obtiveram os melhores valores de aptidão durante o processo de busca



## Reflexões



Você diria que o algoritmo genético é determinístico ou probabilístico?

Será que um algoritmo genético é capaz de encontrar mínimos (ou máximos) da função objetivo?

O que será que acontece quando não realizamos a etapa de mutação do algoritmo genético?

O que será que acontece quando usamos uma chance de mutação muito alta?



## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo genético. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Importações



In [1]:
import random
from funcoes import populacao_cb as cria_populacao_inicial
from funcoes import funcao_objetivo_pop_cb as funcao_objetivo_pop
from funcoes import selecao_roleta_max as funcao_selecao
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_cb as funcao_mutacao

## Códigos e discussão



Para o presente problema, uma nova abordagem, diferente da busca aleatório e da busca em grade será utilizada. Também utilizaremos conceitos de aleatoriedade, mas agora importados da biologia.

Exemplos dessa aleatoriedade é o cruzamento entre dois indivíduos, que pode ser benéfico ao juntar o melhor que cada um pode oferecer, assim como a mutação, que pode gerar vantagens ao decorrer das gerações ao mudar valores gênicos.

Por outro lado, é ainda importante perceber que esses fatores podem ir no sentido contrário, não encontrando respostas melhores, mas piores. É então necessário realizar uma seleção dos melhores por meio da utilização da função de roleta máxima.

In [2]:
# Constantes

TAMANHO_POP = 10
NUM_GENES = 4
NUM_GERACOES = 10
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05

In [3]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

print(f'População inicial de pontuação igual a {sum(funcao_objetivo_pop(populacao))}: \n{populacao}\n')

for _ in range(NUM_GERACOES):
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao,fitness)
    
    # Definição de pais e mães no código
    # Pais são pares, mães são ímpares
    
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    # Código responsável pelo cruzamento de indivíduos
    
    for pai, mae in zip(pais,maes):
        if random.random() < CHANCE_CRUZAMENTO:
            # Vai acontecer cruzamento
            filho1, filho2 = funcao_cruzamento(pai,mae)
            populacao[contador] = filho1
            populacao[contador+1] = filho2
        contador += 2
    
    # Código responsável pela mutação do indivíduo
    # Se um número aleatório for menor que a chance de mutação
    # A mutação irá ser aplicada ao indivíduo
    
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            print(f'Indivíduo mutado: {populacao[n]}',end=' ')
            populacao[n] = funcao_mutacao(populacao[n])
            print(populacao[n])

print(f'\nPopulação final de pontuação igual a {sum(funcao_objetivo_pop(populacao))}: \n{populacao}')

População inicial de pontuação igual a 29: 
[[0, 1, 0, 1], [1, 0, 0, 0], [0, 0, 0, 0], [1, 1, 0, 1], [1, 0, 1, 1], [0, 1, 0, 1], [1, 1, 0, 0], [0, 1, 1, 1], [0, 1, 1, 1], [0, 0, 0, 0]]

Indivíduo mutado: [0, 1, 0, 1] [1, 1, 0, 1]
Indivíduo mutado: [0, 1, 0, 1] [0, 1, 0, 1]
Indivíduo mutado: [1, 1, 1, 1] [1, 1, 1, 0]
Indivíduo mutado: [1, 1, 0, 1] [0, 1, 0, 1]
Indivíduo mutado: [0, 1, 0, 1] [1, 1, 0, 1]

População final de pontuação igual a 41: 
[[1, 1, 1, 1], [1, 1, 0, 1], [1, 1, 1, 1], [1, 1, 0, 1], [1, 1, 0, 1], [1, 1, 0, 1], [1, 1, 0, 1], [1, 1, 0, 1], [0, 1, 0, 1], [1, 1, 0, 1]]


## Conclusão

Neste experimento, o problema das caixas binárias, que é um problema de maximização, foi resolvido por meio da utilização de algoritmos genéticos. Ou seja, foi utilizado ao decorrer do código os conceitos de gene, indivíduo, seleção, cruzamento e mutação.

Em um primeiro contato com o algoritmo genético, o gene foi representado por um valor aleatório entre 0 e 1 e o indivíduo como um conjunto de genes - sequência de zeros e uns. O cruzamento de ponto simples foi utilizado assim como uma simples mutação de troca, de forma a alterar aleatoriamente um valor do gene. Além disso, a seleção de roleta máxima foi usada para seleção.

É válido notar que para problemas mais simples como é o caso das caixas binárias, a solução pode ser evidente, sendo necessária apenas a escolha do valor máximo para cada gene. Porém, no contexto de aplicação computacional, tal compreensão não é convencional, sendo necessária a aplicação de uma abordagem que possa buscar uma solução para cada situação.

Sendo assim, os algoritmos genéticos são uma das possíveis abordagens, de forma que nem todas as possibilidades sejam exploradas, mas a melhor opção dentre as buscadas seja escolhida. Isso pode inclusive ser percebido pela resposta encontrada, haja visto que o melhor indivíduo possível - um indivíduo que não contenha zeros, apenas uns - não foi encontrado, mas sim um melhor que o primeiro.

Testes iniciais foram interessantes como forma de gerar dúvidas, já que pode ser um pouco contra intuitivo utilizar métodos que não busquem a melhor solução dentre todas. Porém, ao decorrer do desenvolvimento do problema, foi tornando-se mais claro que em diversos problemas é inviável a busca de todas as possibilidades, de forma que uma boa saída seja encontrar boas possíveis opções por meio de questões aleatórias, tais como as propostas por conceitos biológicos.

## Playground

