Algoritmo genético
==================



## Introdução



`Algoritmos genéticos` são algoritmos inspirados na teoria da evolução de Darwin e são ferramentas poderosas para resolver problemas de otimização. De maneira simples, a estratégia consiste em gerar uma população inicial aleatória e através de seleção, cruzamento e mutação sucessivas, gerar populações seguintes. Se feito de maneira correta, as populações seguintes tendem a ser melhores candidatos para a solução do problema do que as populações anteriores.

Um algoritmo genético pode parecer um tanto complexo, porém é possível dividi-lo em partes relativamente simples:

1.  Criação da população inicial (aleatória)

2.  Cálculo da função objetivo para todos os membros da população inicial e atualização do hall da fama

3.  Seleção dos indivíduos (quais seguem pra próxima geração)

4.  Cruzamento dos indivíduos selecionados (troca de material genético)

5.  Mutação dos indivíduos da população recém-criada (possibilidade de trazer informação nova ao sistema)

6.  Cálculo da função objetivo para todos os membros da população recém-criada e atualização do hall da fama

7.  Checar os critérios de parada. Caso os critérios não tenham sido atendidos, retornar ao passo 3

8.  Retornar para o usuário o hall da fama



## Glossário



-   `Indivíduo`: um candidato para a solução do problema

-   `População`: um conjunto de candidatos para a solução do problema

-   `Gene`: um parâmetro que pertence a um indivíduo

-   `Cromossomo` ou `genótipo`: um conjunto de genes

-   `Geração`: cada população em uma busca genética faz parte de uma geração. A primeira geração é geralmente formada por indivíduos aleatórios (sorteados dentro do espaço de busca). As gerações seguintes são formadas por seleção, cruzamento e mutação da geração anterior. Um dos critérios de parada possíveis para um algoritmo genético é o número máximo de gerações

-   `Função de aptidão` ou `função objetivo` ou `função fitness`: uma função que recebe um indivíduo e retorna o seu valor de aptidão. Em um problema de otimização, nós buscamos encontrar soluções que minimizam ou maximizam o valor de aptidão

-   `Seleção`: processo onde utilizamos o valor de aptidão dos indivíduos para selecionar quais irão passar seus genes para a geração seguinte

-   `Cruzamento`: processo onde o material genético de indivíduos selecionados é misturado

-   `Mutação`: processo onde os genes dos indivíduos selecionados têm uma chance de alterar seu valor. A mutação é o único processo capaz de introduzir informação nova ao pool genético após o sorteio aleatório da primeira geração

-   `Hall da fama`: conjunto dos $n$ indivíduos que obtiveram os melhores valores de aptidão durante o processo de busca



## Reflexões



Você diria que o algoritmo genético é determinístico ou probabilístico?

Será que um algoritmo genético é capaz de encontrar mínimos (ou máximos) da função objetivo?

O que será que acontece quando não realizamos a etapa de mutação do algoritmo genético?

O que será que acontece quando usamos uma chance de mutação muito alta?



## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo genético. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Importações



In [1]:
import random
from funcoes import populacao_cb as cria_populacao_inicial
from funcoes import funcao_objetivo_pop_cb as funcao_objetivo_pop
from funcoes import selecao_roleta_max as funcao_selecao
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_cb as funcao_mutacao

## Códigos e discussão



In [5]:
# CONSTANTES

TAMANHO_POP = 6
NUM_GENES = 4
NUM_GERACOES = 10
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05

In [6]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

print(populacao)

for _ in range (NUM_GERACOES):
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    pais = populacao[0::2]
    maes = populacao [1::2]
    contador = 0 
    for pai, mae in zip(pais,maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            # ocorre cruzamento XD
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador]=filho1
            populacao[contador+1]=filho2
            
        contador = contador + 2

        for n in range (len(populacao)):
            if random.random() <= CHANCE_MUTACAO:
                individuo = populacao[n]
                populacao[n] = funcao_mutacao(individuo)
                print()
                print(individuo, populacao[n])
                print()
print ()
print ("População final:")
print (populacao)


[[1, 0, 0, 0], [1, 1, 1, 0], [0, 0, 1, 1], [0, 0, 1, 0], [0, 1, 0, 0], [0, 0, 0, 1]]

[1, 1, 1, 0] [1, 1, 1, 0]


[0, 0, 1, 1] [0, 0, 1, 1]


[0, 0, 0, 0] [0, 0, 0, 0]


[1, 1, 0, 0] [1, 1, 0, 0]


[0, 0, 1, 1] [0, 0, 1, 1]


[0, 0, 1, 0] [0, 0, 1, 0]


[1, 1, 1, 0] [1, 1, 1, 0]


[1, 0, 1, 0] [1, 0, 1, 0]


[1, 1, 1, 0] [1, 1, 1, 0]


População final:
[[1, 1, 1, 1], [1, 1, 1, 0], [1, 0, 1, 0], [1, 1, 1, 0], [0, 1, 1, 1], [0, 1, 1, 1]]


## Conclusão

Os algoritmos genéticos apresentam várias variáveis que auxiliam no processo de encontrar o melhor "gene" ou melhor "indíviduo" para o problema em questão, ou melhor, mais adaptado.

Neste notebook, realizamos o exercício 03 onde foi inserido o conceito de cruzamento entre genes, misturando assim os melhores, com o intuito de preservar suas características e passar o seu material genético para a próxima geração, assim utilizando a estatística e variabilidade ao nosso favor.<dt>
Concluímos que o nosso algorítmo teve um rendimento bom e funcional, conseguindo mesclar e selecionar os indiviuos que apresentavam os melhores genes.

## Playground



Teste com Chat GPT : 

"give-me a python code that get the higher value of a binarie sistem 1 and 0 in 4 boxes. Use the method of genethic algorithim" 

In [8]:
import random

# define the fitness function
def fitness(individual):
    return int(individual, 2)

# define the genetic algorithm
def genetic_algorithm(population_size, fitness_fn, mutation_rate=0.01, generations=100):
    # generate an initial population of random individuals
    population = [bin(random.randint(0, 15))[2:].zfill(4) for i in range(population_size)]

    for i in range(generations):
        # evaluate the fitness of each individual in the population
        fitness_scores = [fitness_fn(individual) for individual in population]

        # select the fittest individuals to be parents
        parents = [population[fitness_scores.index(max(fitness_scores))]]
        parents += [population[random.choices(range(population_size), weights=fitness_scores)[0]] for j in range(population_size - 1)]

        # generate offspring by crossover and mutation
        offspring = []
        for j in range(population_size):
            parent1, parent2 = random.sample(parents, 2)
            offspring.append(''.join([parent1[k] if random.random() < 0.5 else parent2[k] for k in range(len(parent1))]))
            if random.random() < mutation_rate:
                mutation_index = random.randint(0, 3)
                offspring[-1] = offspring[-1][:mutation_index] + ('0' if offspring[-1][mutation_index] == '1' else '1') + offspring[-1][mutation_index+1:]

        # replace the old population with the new offspring
        population = offspring

    # return the fittest individual in the final population
    return max(population, key=fitness_fn)

# run the genetic algorithm to find the highest binary number with 4 digits
solution = genetic_algorithm(population_size=50, fitness_fn=fitness, generations=1000)
print('The highest value of a binary system with 4 digits is:', solution, '=', int(solution, 2))


The highest value of a binary system with 4 digits is: 1111 = 15
