Algoritmo genético
==================



## Introdução



`Algoritmos genéticos` são algoritmos inspirados na teoria da evolução de Darwin e são ferramentas poderosas para resolver problemas de otimização. De maneira simples, a estratégia consiste em gerar uma população inicial aleatória e através de seleção, cruzamento e mutação sucessivas, gerar populações seguintes. Se feito de maneira correta, as populações seguintes tendem a ser melhores candidatos para a solução do problema do que as populações anteriores.

Um algoritmo genético pode parecer um tanto complexo, porém é possível dividi-lo em partes relativamente simples:

1.  Criação da população inicial (aleatória)

2.  Cálculo da função objetivo para todos os membros da população inicial e atualização do hall da fama

3.  Seleção dos indivíduos (quais seguem pra próxima geração)

4.  Cruzamento dos indivíduos selecionados (troca de material genético)

5.  Mutação dos indivíduos da população recém-criada (possibilidade de trazer informação nova ao sistema)

6.  Cálculo da função objetivo para todos os membros da população recém-criada e atualização do hall da fama

7.  Checar os critérios de parada. Caso os critérios não tenham sido atendidos, retornar ao passo 3

8.  Retornar para o usuário o hall da fama



## Glossário



-   `Indivíduo`: um candidato para a solução do problema

-   `População`: um conjunto de candidatos para a solução do problema

-   `Gene`: um parâmetro que pertence a um indivíduo

-   `Cromossomo` ou `genótipo`: um conjunto de genes

-   `Geração`: cada população em uma busca genética faz parte de uma geração. A primeira geração é geralmente formada por indivíduos aleatórios (sorteados dentro do espaço de busca). As gerações seguintes são formadas por seleção, cruzamento e mutação da geração anterior. Um dos critérios de parada possíveis para um algoritmo genético é o número máximo de gerações

-   `Função de aptidão` ou `função objetivo` ou `função fitness`: uma função que recebe um indivíduo e retorna o seu valor de aptidão. Em um problema de otimização, nós buscamos encontrar soluções que minimizam ou maximizam o valor de aptidão

-   `Seleção`: processo onde utilizamos o valor de aptidão dos indivíduos para selecionar quais irão passar seus genes para a geração seguinte

-   `Cruzamento`: processo onde o material genético de indivíduos selecionados é misturado

-   `Mutação`: processo onde os genes dos indivíduos selecionados têm uma chance de alterar seu valor. A mutação é o único processo capaz de introduzir informação nova ao pool genético após o sorteio aleatório da primeira geração

-   `Hall da fama`: conjunto dos $n$ indivíduos que obtiveram os melhores valores de aptidão durante o processo de busca



## Reflexões



Você diria que o algoritmo genético é determinístico ou probabilístico?

Será que um algoritmo genético é capaz de encontrar mínimos (ou máximos) da função objetivo?

O que será que acontece quando não realizamos a etapa de mutação do algoritmo genético?

O que será que acontece quando usamos uma chance de mutação muito alta?



## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo genético. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Importações



In [1]:
import random
from funcoes import funcao_objetivo_cb, individuo_cb
from funcoes import populacao_cb as cria_pop_ini
from funcoes import funcao_obj_pop_cb as funcao_objetivo_pop
from funcoes import selecao_roleta_max as funcao_selecao
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_cb as funcao_mutacao

## Códigos e discussão



In [2]:
#Vamos criar uma população inicial (vulgo lista/caixa)

# função objetivo para a população e criar o hall da fama;

# Seleção dos indivíduos;

# Cruzamento;

# Mutação;

# função da obj nova geração de indivíduos e atualizar o hall da fama;

# Checar os critérios de parada;

#

In [10]:
#Constantes
TAMANHO_POP = 6
NUM_GENES = 4
NUM_GERACOES = 10
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05

In [21]:
# Vamos criar uma população inicial (vulgo lista/caixa)

populacao = cria_pop_ini(TAMANHO_POP, NUM_GENES)

print(populacao)
print()

# o "_" indica que a função não é tão importante
for n in range(NUM_GERACOES):
    # função objetivo para a população e criar o hall da fama;
    fitness = funcao_objetivo_pop(populacao)

    # Seleção dos indivíduos
    populacao = funcao_selecao(populacao, fitness)

    pais = populacao[0::2]
    maes = populacao[1::2]

    contador = 0

    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        contador = contador + 2
        
    for i in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[i]
            print()
            print(individuo)
            populacao[i] = funcao_mutacao(individuo)
            print(populacao[i])
                  
print()
print("População final:", populacao)

[[1, 0, 0, 0], [0, 1, 0, 0], [1, 0, 0, 0], [1, 1, 1, 1], [0, 1, 1, 0], [1, 0, 0, 1]]


[0, 1, 1, 0]
[0, 1, 1, 0]

[0, 0, 1, 0]
[0, 0, 1, 0]

[1, 1, 1, 0]
[0, 1, 1, 0]

[1, 1, 1, 0]
[1, 1, 0, 0]

[0, 0, 0, 1]
[0, 0, 1, 1]

[0, 0, 0, 1]
[0, 0, 0, 1]

População final: [[1, 1, 1, 1], [0, 1, 1, 1], [0, 1, 1, 1], [1, 1, 1, 0], [1, 1, 1, 1], [0, 1, 1, 1]]


## Conclusão


Partimos do princípio que o AL é probabilístico, inclusive ele pode para antes do esperado (e achar máximos e mínimos locais) em vez de parar realmente na melhor opção/individuo (aí sim teríamos os máximos e mínimos globais).

Se não realizarmos a mutação, teremos menos chances de chegar no melhor individuo, pois não existe uma forma de adicionar um novo gene que vai garantir a chance de existir o melhor individuo, a depender da população inicial não realizar a mutação pode garantir que não existe uma resposta para o problema, vulgo melhor individuo.

Mas se utilizarmos muitas mutações, dificilmente vamos achar uma população boa para passar para a nova etapa.

O AL é milhares de vezes mais eficiente que Busca aleatória e busca em grade, quando falamos em resolver problemas mais complexos

## Hipocampo

Essas aulas de programação tão matando meu 1 ano de bio

## Referências consultadas

## Playground



In [5]:
import random

# Define as capacidades das caixas
capacities = [50, 50, 50, 50]

# Define os objetos a serem alocados nas caixas
objects = [10, 20, 30, 10, 20, 30, 10, 20, 30, 10, 20, 30, 10, 20, 30, 10, 20, 30, 10, 20]

# Define a função de fitness que avalia a qualidade de cada indivíduo
def fitness(individual):
    # Inicializa a quantidade de objetos em cada caixa
    boxes = [0] * len(capacities)

    # Atribui os objetos alocados em cada caixa
    for i, gene in enumerate(individual):
        if gene == 1:
            boxes[i] += objects[i]
            if boxes[i] > capacities[i]:
                return 0  # solução inválida

    # Retorna o número de caixas utilizadas como fitness
    return sum([1 for box in boxes if box > 0])

# Define os parâmetros do algoritmo genético
population_size = 50
mutation_rate = 0.01
generations = 100

# Gera a população inicial
population = [[random.randint(0, 1) for _ in range(len(capacities))] for _ in range(population_size)]

# Executa o algoritmo genético
for i in range(generations):
    # Avalia a qualidade da população
    fitness_values = [fitness(individual) for individual in population]

    # Seleciona os pais usando seleção por torneio
    parents = []
    for j in range(population_size):
        tournament = random.sample(range(population_size), 5)
        tournament_fitness = [fitness_values[k] for k in tournament]
        winner = tournament_fitness.index(max(tournament_fitness))
        parents.append(population[tournament[winner]])

    # Realiza o crossover de um ponto
    children = []
    for j in range(0, population_size, 2):
        crossover_point = random.randint(1, len(capacities) - 1)
        child1 = parents[j][:crossover_point] + parents[j+1][crossover_point:]
        child2 = parents[j+1][:crossover_point] + parents[j][crossover_point:]
        children.append(child1)
        children.append(child2)

    # Realiza a mutação dos genes dos filhos
    for child in children:
        for j in range(len(capacities)):
            if random.random() < mutation_rate:
                child[j] = 1 - child[j]

    # Atualiza a população com os filhos gerados
    population = children

# Avalia a qualidade final da população
fitness_values = [fitness(individual) for individual in population]

# Seleciona a melhor solução
best_solution_index = fitness_values.index(max(fitness_values))
best_solution = population[best_solution_index]

# Imprime a melhor solução encontrada
print("Melhor solução encontrada:", best_solution)
print("Número de caixas utilizadas:", fitness(best_solution))


Melhor solução encontrada: [1, 1, 1, 1]
Número de caixas utilizadas: 4
