Algoritmo genético
==================



## Introdução



`Algoritmos genéticos` são algoritmos inspirados na teoria da evolução de Darwin e são ferramentas poderosas para resolver problemas de otimização. De maneira simples, a estratégia consiste em gerar uma população inicial aleatória e através de seleção, cruzamento e mutação sucessivas, gerar populações seguintes. Se feito de maneira correta, as populações seguintes tendem a ser melhores candidatos para a solução do problema do que as populações anteriores.

Um algoritmo genético pode parecer um tanto complexo, porém é possível dividi-lo em partes relativamente simples:

1.  Criação da população inicial (aleatória)

2.  Cálculo da função objetivo para todos os membros da população inicial e atualização do hall da fama

3.  Seleção dos indivíduos (quais seguem pra próxima geração)

4.  Cruzamento dos indivíduos selecionados (troca de material genético)

5.  Mutação dos indivíduos da população recém-criada (possibilidade de trazer informação nova ao sistema)

6.  Cálculo da função objetivo para todos os membros da população recém-criada e atualização do hall da fama

7.  Checar os critérios de parada. Caso os critérios não tenham sido atendidos, retornar ao passo 3

8.  Retornar para o usuário o hall da fama



## Glossário



-   `Indivíduo`: um candidato para a solução do problema

-   `População`: um conjunto de candidatos para a solução do problema

-   `Gene`: um parâmetro que pertence a um indivíduo

-   `Cromossomo` ou `genótipo`: um conjunto de genes

-   `Geração`: cada população em uma busca genética faz parte de uma geração. A primeira geração é geralmente formada por indivíduos aleatórios (sorteados dentro do espaço de busca). As gerações seguintes são formadas por seleção, cruzamento e mutação da geração anterior. Um dos critérios de parada possíveis para um algoritmo genético é o número máximo de gerações

-   `Função de aptidão` ou `função objetivo` ou `função fitness`: uma função que recebe um indivíduo e retorna o seu valor de aptidão. Em um problema de otimização, nós buscamos encontrar soluções que minimizam ou maximizam o valor de aptidão

-   `Seleção`: processo onde utilizamos o valor de aptidão dos indivíduos para selecionar quais irão passar seus genes para a geração seguinte

-   `Cruzamento`: processo onde o material genético de indivíduos selecionados é misturado

-   `Mutação`: processo onde os genes dos indivíduos selecionados têm uma chance de alterar seu valor. A mutação é o único processo capaz de introduzir informação nova ao pool genético após o sorteio aleatório da primeira geração

-   `Hall da fama`: conjunto dos $n$ indivíduos que obtiveram os melhores valores de aptidão durante o processo de busca



## Reflexões



Você diria que o algoritmo genético é determinístico ou probabilístico?

- Probabilístico, assim como no processo de evolução na biologia.

Será que um algoritmo genético é capaz de encontrar mínimos (ou máximos) da função objetivo?

- Não exatamente, dado que é probabilístico, mas talvez chegue perto desse valor.

O que será que acontece quando não realizamos a etapa de mutação do algoritmo genético?

- Não haverá grandes novidades no código genético e teremos poucas chances de realmente encontrar a solução do nosso código.

O que será que acontece quando usamos uma chance de mutação muito alta?

- Nosso problema terá poucas chances de ser realmente resolvido, porque chegaremos na melhor solução e rapidamente ela sera perdida devido às mutações, chegando a ser um sorteio quase que aleatório e não de fato uma seleção.

## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo genético. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Importações



In [1]:
from funcoes import populacao_cb as cria_populacao_inicial
from funcoes import funcao_objetivo_pop_cb as funcao_objetivo_pop
from funcoes import selecao_roleta_max as funcao_selecao
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_cb as funcao_mutacao
import random

## Códigos e discussão



Para esse experimento temos também o objetivo de resolver o problema das caixas binárias, assim como nos 2 experimentos anteriores, no entanto, dessa vez, entraremos de verdade na matéria de Algoritmos Genéticos, utilizando esses conceitos para resolver o problema.

Começamos por importar funções codadas e armazenadas no arquivo `funcoes.py`, o que permitirá o uso dessas mesmas funções em experimentos futuros.

Para darmos início ao experimento faz-se muito importante determinarmos os parâmetros, constantes, que serão utilizados nas funções.

Vale ressaltar que as `constantes relacionadas à busca` são constantes que podem ser alteradas por nós para resolvermos o problema de uma forma melhor, mais eficiente e diferente. Já as `constantes relacionadas ao problema a ser resolvido` não devem ser alteradas, pois modificá-las implica dizer que alteramos o problema a ser resolvido, dado que esses exatos números são necessários para que sejam cumpridas as exigências do enunciado.

In [2]:
# constantes

# relacionadas à busca
TAMANHO_POP = 6
NUM_GENES = 4
NUM_GERACOES = 5
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05

#relacionadas ao problema a ser resolvido
NUM_GENES = 4

Seguindo as instruções dadas anteriormente, o primeiro passo na implementação de um algoritmo genético é criar a população inicial(aleatória), o que é cumprida pela função `cria_populacao_inicial`, depois é feito o cálcul da função objetivo para todos os indivíduos e criada uma nova população de acordo com o desempenho, fitness, que eles tiveram na função objetivo.

Logo após isso são selecionados os indivíduos que serão os pais e as mães da próxima geração, iniciado um contador que servirá para iterar a lista e adicionar os filhos à lista da população. Outra parte chave para o entendimento desse código é que tanto o cruzamento quanto a mutação só ocorrem a partir de chances pré-determinadas anteriormente pelos parâmetros `CHANCE_CRUZAMENTO` e `CHANCE_MUTACAO`

O modo como são calculadas, de fato, essas chances no código envolvem o uso do método `random()`; o que esse método faz no caso é gerar um número aleatório de 0 a 1, então podemos falar que se esse número gerado for menor ou igual à chance que determinamos antes(que também vai de 0 a 1), a mutação ou o cruzamento ocorrem. 

In [3]:
populacao = cria_populacao_inicial (TAMANHO_POP, NUM_GENES)

print("População inicial:")
print(populacao)

for n in range(NUM_GERACOES): # enquanto o número máximo de gerações não tiver sido atingido 
    
    # seleção
    fitness = funcao_objetivo_pop(populacao) # calcula o fitness de cada indivíduo conforme a função anteriormente definida
    populacao = funcao_selecao(populacao, fitness) # cria nova população selecionada pela função roleta, com pesos baseados no desempenho que a população anterior obteve no fitnes
    
    # cruzamento
    pais = populacao[0::2] # partindo do primeiro elemento seleciona elementos de 2 em 2 para serem os pais
    maes = populacao[1::2] # partindo do segundo elemento seleciona elementos de 2 em 2 para serem as mães
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO: 
            # vai acontecer cruzamento
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
            
        contador = contador + 2
        
    # mutação
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            #print()
            #print(individuo)
            populacao[n] = funcao_mutacao(individuo)
            #print(populacao[n])
            #print()
            
print()
print("População final:")
print(populacao)

População inicial:
[[0, 1, 1, 1], [1, 0, 1, 0], [1, 0, 1, 0], [1, 1, 0, 1], [1, 1, 1, 0], [0, 0, 1, 0]]

População final:
[[0, 1, 1, 0], [1, 1, 0, 1], [0, 1, 1, 0], [0, 1, 1, 1], [0, 1, 1, 1], [1, 1, 0, 1]]


## Conclusão



Dessa forma, durante esse experimento pudemos resolver o problema das caixas binárias por meios dos Algoritmos Genéticos e nos familiarizarmos com sua nomenclatura e particularidades, utilizando esses conceitos para resolver o problema.

O problema das caixas binárias foi, assim, resolvido de modo satisfatório por meio dessa implementação, como pudemos ver acima.

No entanto, ao construir e rodar o código foi possível perceber, como suspeitava antes, assim como registrado na parte de reflexões; que o método do algoritmo genético é, de fato, probabilístico e também que não necessariamente encontrará o máximo e o mínimo das funções, mas pode chegar a valores bem próximos deles.


Além disso, foi interessante perceber como nesse modelo as mudanças que são possíveis de serem realizadas nos parâmetros aumentam ainda mais as possibilidades de ajustes, respostas, bem como aplicabilidades de um mesmo algoritmo. Isso certamente será útil mais à frente &#x1F604;.



## Playground

