Algoritmo genético
==================



## Introdução



`Algoritmos genéticos` são algoritmos inspirados na teoria da evolução de Darwin e são ferramentas poderosas para resolver problemas de otimização. De maneira simples, a estratégia consiste em gerar uma população inicial aleatória e através de seleção, cruzamento e mutação sucessivas, gerar populações seguintes. Se feito de maneira correta, as populações seguintes tendem a ser melhores candidatos para a solução do problema do que as populações anteriores.

Um algoritmo genético pode parecer um tanto complexo, porém é possível dividi-lo em partes relativamente simples:

1.  Criação da população inicial (aleatória)

2.  Cálculo da função objetivo para todos os membros da população inicial e atualização do hall da fama

3.  Seleção dos indivíduos (quais seguem pra próxima geração)

4.  Cruzamento dos indivíduos selecionados (troca de material genético)

5.  Mutação dos indivíduos da população recém-criada (possibilidade de trazer informação nova ao sistema)

6.  Cálculo da função objetivo para todos os membros da população recém-criada e atualização do hall da fama

7.  Checar os critérios de parada. Caso os critérios não tenham sido atendidos, retornar ao passo 3

8.  Retornar para o usuário o hall da fama



## Glossário



-   `Indivíduo`: um candidato para a solução do problema

-   `População`: um conjunto de candidatos para a solução do problema

-   `Gene`: um parâmetro que pertence a um indivíduo

-   `Cromossomo` ou `genótipo`: um conjunto de genes

-   `Geração`: cada população em uma busca genética faz parte de uma geração. A primeira geração é geralmente formada por indivíduos aleatórios (sorteados dentro do espaço de busca). As gerações seguintes são formadas por seleção, cruzamento e mutação da geração anterior. Um dos critérios de parada possíveis para um algoritmo genético é o número máximo de gerações

-   `Função de aptidão` ou `função objetivo` ou `função fitness`: uma função que recebe um indivíduo e retorna o seu valor de aptidão. Em um problema de otimização, nós buscamos encontrar soluções que minimizam ou maximizam o valor de aptidão

-   `Seleção`: processo onde utilizamos o valor de aptidão dos indivíduos para selecionar quais irão passar seus genes para a geração seguinte

-   `Cruzamento`: processo onde o material genético de indivíduos selecionados é misturado

-   `Mutação`: processo onde os genes dos indivíduos selecionados têm uma chance de alterar seu valor. A mutação é o único processo capaz de introduzir informação nova ao pool genético após o sorteio aleatório da primeira geração

-   `Hall da fama`: conjunto dos $n$ indivíduos que obtiveram os melhores valores de aptidão durante o processo de busca



## Reflexões



Você diria que o algoritmo genético é determinístico ou probabilístico?

Será que um algoritmo genético é capaz de encontrar mínimos (ou máximos) da função objetivo?

O que será que acontece quando não realizamos a etapa de mutação do algoritmo genético?

O que será que acontece quando usamos uma chance de mutação muito alta?



## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo genético. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Importações



In [1]:
# As funções recebem nomes simplificados dentro deste algoritmo
from funcoes import populacao_cb as cria_populacao_inicial
from funcoes import funcao_objetivo_pop_cd as funcao_objetivo_pop
from funcoes import selecao_roleta_max as funcao_selecao
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_cb as funcao_mutacao
import random

## Códigos e discussão



In [2]:
# Constantes

TAMANHO_POP = 10
NUM_GENES = 4
NUM_GERACOES = 25
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05 # Escolher um valor razoável para não perder informação genética

In [3]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

print('população inicial:')
print(populacao)

for n in range(NUM_GERACOES): # gera uma população aleatoriamente
    fitness = funcao_objetivo_pop(populacao) # define o peso para cada indivíduo, considerando o tamanho da população como peso máximo
    populacao = funcao_selecao(populacao, fitness)
    
    pais = populacao[0::2] # alterna na população a cada dois indivíduos, começando por ímpar
    maes = populacao[1::2] # alterna na população a cada dois indivíduos, começando por par
    
    contador = 0
    
    for pai, mae in zip (pais, maes): # Combinação entre os genes dos individuos com base na chance de cruzamento
        if random.random() < CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        contador = contador + 2
        
    for n in range(len(populacao)): # Mutação aleatória dos genes da nova população
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)
            print()
            print(individuo, populacao[n])
            
print()
print('população final:')
print(populacao)

população inicial:
[[1, 1, 1, 0], [1, 1, 1, 0], [1, 1, 0, 1], [1, 1, 1, 0], [1, 1, 0, 0], [1, 1, 0, 1], [1, 0, 0, 0], [1, 1, 0, 1], [0, 0, 1, 1], [0, 1, 1, 0]]

[1, 1, 1, 0] [1, 1, 1, 0]

[1, 1, 0, 1] [1, 1, 0, 1]

[1, 1, 1, 0] [1, 1, 1, 0]

[1, 0, 1, 1] [1, 0, 1, 1]

[1, 0, 1, 1] [1, 0, 1, 1]

[1, 1, 0, 1] [1, 1, 0, 1]

[1, 1, 0, 1] [1, 1, 0, 1]

[1, 0, 1, 1] [1, 0, 1, 1]

[1, 1, 1, 1] [1, 1, 1, 1]

[0, 1, 0, 1] [0, 1, 0, 1]

[1, 1, 1, 1] [1, 1, 1, 1]

[1, 1, 1, 1] [1, 1, 1, 1]

população final:
[[1, 1, 0, 1], [1, 1, 0, 1], [1, 1, 1, 1], [1, 1, 1, 1], [1, 1, 0, 1], [1, 1, 1, 1], [1, 1, 0, 1], [1, 1, 1, 1], [1, 1, 0, 1], [1, 1, 1, 1]]


## Conclusão



Primeiramente, é gerada uma população que considera o tamanho da população e a quantidade de genes. Essa população passa por uma seleção aleatória ponderada, na qual são atribuídos pesos diferentes para cada indivíduo. Utilizando o método random e a divisão de listas, os genes dos pais e das mães são misturados para, em seguida, executar a concatenação entre os dois segmentos de listas, correspondentes aos pais e às mães.

Por último, a função gene da caixa binária é aplicada para alterar um dos genes dos filhos.

O método randint foi empregado para determinar aleatoriamente o ponto de corte e o gene a ser mutado, incluindo o primeiro gene do indivíduo, mas excluindo o último por padrão, por isso o uso do "-1".

O algoritmo tem algumas limitações, pois não considera as especificidades de cruzamento entre indivíduos, como a não possibilidade de cruzamento entre os indivíduos, um macho cruzar com mais de uma fêmea e a influência dos genes entre o pai e a mãe é de igual proporção para o indivíduo. Além disso, não permite um controle sobre a mutação, pois todo o processo desde a seleção, combinação, até a mutação ocorre ao acaso.

Algumas observações: O parâmetro do tamanho da população influencia na maior variabilidade genética. Ao aumentar o tamanho da população e/ou o número de gerações, a quantidade de filhos também aumenta. Mesmo alterando todos os parâmetros, não foi identificada variação entre os genes de cada par de filhos.

## Playground

