Algoritmo genético
==================



## Introdução



`Algoritmos genéticos` são algoritmos inspirados na teoria da evolução de Darwin e são ferramentas poderosas para resolver problemas de otimização. De maneira simples, a estratégia consiste em gerar uma população inicial aleatória e através de seleção, cruzamento e mutação sucessivas, gerar populações seguintes. Se feito de maneira correta, as populações seguintes tendem a ser melhores candidatos para a solução do problema do que as populações anteriores.

Um algoritmo genético pode parecer um tanto complexo, porém é possível dividi-lo em partes relativamente simples:

1.  Criação da população inicial (aleatória);

2.  Cálculo da função objetivo para todos os membros da população inicial e atualização do hall da fama;

3.  Seleção dos indivíduos (quais seguem pra próxima geração);

4.  Cruzamento dos indivíduos selecionados (troca de material genético);

5.  Mutação dos indivíduos da população recém-criada (possibilidade de trazer informação nova ao sistema);

6.  Cálculo da função objetivo para todos os membros da população recém-criada e atualização do hall da fama;

7.  Checar os critérios de parada. Caso os critérios não tenham sido atendidos, retornar ao passo 3;

8.  Retornar para o usuário o hall da fama.



## Glossário



-   `Indivíduo`: um candidato para a solução do problema.

-   `População`: um conjunto de candidatos para a solução do problema.

-   `Gene`: um parâmetro que pertence a um indivíduo.

-   `Cromossomo` ou `genótipo`: um conjunto de genes.

-   `Geração`: cada população em uma busca genética faz parte de uma geração. A primeira geração é geralmente formada por indivíduos aleatórios (sorteados dentro do espaço de busca). As gerações seguintes são formadas por seleção, cruzamento e mutação da geração anterior. Um dos critérios de parada possíveis para um algoritmo genético é o número máximo de gerações.

-   `Função de aptidão` ou `função objetivo` ou `função fitness`: uma função que recebe um indivíduo e retorna o seu valor de aptidão. Em um problema de otimização, nós buscamos encontrar soluções que minimizam ou maximizam o valor de aptidão.

-   `Seleção`: processo onde utilizamos o valor de aptidão dos indivíduos para selecionar quais irão passar seus genes para a geração seguinte.

-   `Cruzamento`: processo onde o material genético de indivíduos selecionados é misturado.

-   `Mutação`: processo onde os genes dos indivíduos selecionados têm uma chance de alterar seu valor. A mutação é o único processo capaz de introduzir informação nova ao pool genético após o sorteio aleatório da primeira geração.

-   `Hall da fama`: conjunto dos $n$ indivíduos que obtiveram os melhores valores de aptidão durante o processo de busca.



## Reflexões



Você diria que o algoritmo genético é determinístico ou probabilístico?

Será que um algoritmo genético é capaz de encontrar mínimos (ou máximos) da função objetivo?

O que será que acontece quando não realizamos a etapa de mutação do algoritmo genético?

O que será que acontece quando usamos uma chance de mutação muito alta?



## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo genético. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Importações



In [44]:
from funcoes import populacao_caixabinaria as cria_populacao_inicial
from funcoes import funcao_objetivo_populacao_caixabinaria as funcao_objetivo_populacao
from funcoes import selecao_roleta_max as funcao_selecao
from funcoes import cruzamento_simples as funcao_cruzamento
from funcoes import mutacao_caixabinaria as funcao_mutacao
import random

# A importação (from funcoes) é devido ao arquivo funcoes.py, onde todas as funções estão devidamente explicadas.
# Para facilitar, são exportadas e com outro nome que torne mais fácil sua interpretação.

## Códigos e discussão



In [45]:
#Definição das constantes:

TAMANHO_POPULACAO = 6 #Tamanho de indivíduos dentro de uma população.
NUMERO_GENES = 4 #Quantidade de genes de cada indivíduo [x, x, x, x].
NUMERO_GERACOES = 15 #Quantas vezes o repetirá para que seja selecionado um indivíduo.
CHANCE_CRUZAMENTO = 0.5 #Geralmente se usa essa taxa de  50%, serve para informar que nem todo mundo "vivo" vai passar os genes.
CHANCE_MUTACAO = 0.05 #É a chance de mutação, não pode ser muito alta pois entra no problema de busca aleatória, nem muito baixa, pois demorará mais para evoluir na passagem de informação gênica.

# Vale a ressalva que alterar as quantidades das constantes é válido para testes afim de especular diferentes resultados.

In [46]:
# Criamos uma "população" aqui, onde seu tamanho foi definido nas constantes tal qual o número de genes.
# É válido a criação de uma populaççao uma vez que queremos explorar os mecanismos de seleção, cruzamento e mutação.
populacao = cria_populacao_inicial(TAMANHO_POPULACAO, NUMERO_GENES) 
print('População inicial:') #Nos mostra a população integra.
print(populacao)

for n in range(NUMERO_GERACOES): #Dentro do "range" que abrange o número de gerações.
    fitness = funcao_objetivo_populacao(populacao) #O fitness tem praticamente a mesma função que a funcao_objetivo_caixabinaria. É ter um "valor" baseado no máximo.
    populacao = funcao_selecao(populacao, fitness) #Aqui os indivíduos serão selecionados com base em uma "roleta", sua chance maior de ser escolhido é pesada pelo fitness.

    #Separa-se em dois grupos a nossa população afim de podermos fazer com que haja derivados misturados desses dois grupos.
    #Esta parte está melhor explicada no READM.ME no exercício A.03, vale uma atenção a mais para esse método de separação.
    pais = populacao[0::2] #O 0 está indicando a partir de qual elemento da sequência Python começa a contar e 2 é o intervalo.
    maes = populacao[1::2] #O mesmo aqui, porém se começa a contar a partir do elemento 1.

    contador = 0 #Esse contador foi implementado como uma forma de substituir o lugar da mãe e do pai pelo filho1 e filho2 dentro da lista.

    #Parte que realiza o cruzamento baseada na chance.
    for pai, mae in zip(pais, maes): #O zip faz um "pareamento" das listas. Está melhor explicado no arquivo nessa pasta de "Algumas coisas valem a pena aprender ou relembrar"
        if random.random() <=CHANCE_CRUZAMENTO: #random.random é um número real aleatório entre 0 e 1 que ira ser comparado com a chance de cruzamente anteriormente ditada.
            filho1, filho2 = funcao_cruzamento(pai, mae) #O dois filhos aqui serão cruzamento dos pais/mães. Dá-se na ração dois pais e dois filhos sempre, nos nossos casos.
            populacao[contador] = filho1 #Aplica-se a substituição na lista do filho 1.
            populacao[contador + 1] = filho2 #Mesma coisa que acima mas para o filho 2.
        contador = contador + 2 #Posição no contador acrecida de 2 afim de alocar os filhos no lugar dos pais.

    for n in range(len(populacao)): #Lê-se: para cada elemento no "range" do comprimento da população.
        if random.random() <= CHANCE_MUTACAO: #random.random é um número real aleatório entre 0 e 1 que ira ser comparado com a chance de mutação anteriormente ditada.
            individuo = populacao[n] #Lê-se: O indivíduo é um elemento n na população.
            print()
            print(individuo)
            populacao[n] = funcao_mutacao(individuo) #Aqui a mutação acontecerá baseada se sua chance foi menor ou igual a taxa de mutação ditada anteriormente.
            print(populacao[n])
            print()
            #As funções print aqui estão listadas afim de mostrar melhor onde a mutação aconteceu. 
print()
print('População final:') #Nos mostra a população após a mutação.
print(populacao)

População inicial:
[[0, 1, 1, 1], [0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 1], [1, 0, 1, 1], [1, 1, 1, 0]]

[1, 1, 1, 0]
[1, 1, 1, 0]


[1, 1, 1, 0]
[1, 1, 1, 0]


[1, 1, 1, 1]
[1, 1, 1, 1]


[1, 1, 1, 1]
[1, 1, 0, 1]


[1, 1, 1, 1]
[1, 1, 1, 1]


[1, 1, 1, 1]
[1, 1, 1, 1]


[1, 1, 0, 1]
[1, 1, 0, 1]


[1, 1, 0, 1]
[1, 0, 0, 1]


[1, 1, 1, 1]
[1, 0, 1, 1]


População final:
[[1, 1, 0, 1], [1, 1, 0, 1], [1, 0, 1, 1], [1, 1, 0, 1], [1, 1, 0, 1], [1, 1, 0, 1]]


## Conclusão

Pudemos ver que usando somente a parte de `"seleção"`, que não temos a mistura dos genes, logo nem mutações. Por sorte, o indivíduo com os genes que for selecionado ira dominar e se consagrar na população final como único.

Depois, com a parte de `"cruzamento"`, pudemos obter respostas que não teríamos utilizando somente seleção. Pode não ser o "melhor" resultado, mas no final foi o que ficou. Ele faz um cruzamento aleatório, cada vez que rodarmos o código obteremos um resultado diferente.

Implementando a `"mutação"` o algoritmo se torna completo nas suas três etapas essenciais (**_seleção > cruzamento > mutação_**). Pudemos vizualizar a mutação de um gene selecionado (a mais simples) e como isso afetou nosso resultado final. Vale lembrar que uma mutação muito alta faz com que se perca o trabalho realizado nas etapas anteriores.


## Playground



Fiz novamente pelo CHAT GPT, mesmo pedindo somente o parâmetro de seleção ele dá um jeito de implementar alguns que envolvam cruzamento, aparentemente. Achei legal que ele define como "tamanho do cromossomo" a quantidade de genes, [w,x,y,z] = CHROMOSSOME SIZE = 4, além desse "SELECTION RATE", para selecionar somente metade dos indivíduos. Diferente da seleção que fizemos, o CHAT GPT implementa uma que, acredito, seja mais específica.

In [47]:
import random

# Definir os parâmetros do algoritmo genético
POPULATION_SIZE = 5
GENERATIONS = 5
SELECTION_RATE = 0.5
CHROMOSOME_SIZE = 4

# Criar uma função de aptidão que avalie a qualidade de cada indivíduo
def fitness(individual):
    boxes = [[0, 2], [1], [3], []]  # valores em cada caixa
    total = 0
    for i in range(CHROMOSOME_SIZE):
        if individual[i] == 1:
            total += sum(boxes[i])
    return total

# Gerar a população inicial de forma aleatória
def generate_individual():
    return [random.randint(0, 1) for _ in range(CHROMOSOME_SIZE)]

population = [generate_individual() for _ in range(POPULATION_SIZE)]

# Executar o loop de evolução
for generation in range(GENERATIONS):
    # Avaliar a aptidão de cada indivíduo da população
    fitness_scores = [(individual, fitness(individual)) for individual in population]
    fitness_scores.sort(reverse=True, key=lambda x: x[1])
    fittest_individual = fitness_scores[0][0]
    print("Generation:", generation, "Fittest:", fittest_individual, "Fitness Score:", fitness_scores[0][1])

    # Selecionar os indivíduos mais aptos para reprodução
    selected_individuals = [individual for individual, _ in fitness_scores[:int(POPULATION_SIZE * SELECTION_RATE)]]

    # Criar uma nova população somente com os indivíduos selecionados
    population = selected_individuals + [generate_individual() for _ in range(POPULATION_SIZE - len(selected_individuals))]


Generation: 0 Fittest: [0, 1, 1, 1] Fitness Score: 4
Generation: 1 Fittest: [0, 1, 1, 1] Fitness Score: 4
Generation: 2 Fittest: [1, 1, 1, 1] Fitness Score: 6
Generation: 3 Fittest: [1, 1, 1, 1] Fitness Score: 6
Generation: 4 Fittest: [1, 1, 1, 1] Fitness Score: 6
