Algoritmo genético
==================



## Introdução



`Algoritmos genéticos` são algoritmos inspirados na teoria da evolução de Darwin e são ferramentas poderosas para resolver problemas de otimização. De maneira simples, a estratégia consiste em gerar uma população inicial aleatória e através de seleção, cruzamento e mutação sucessivas, gerar populações seguintes. Se feito de maneira correta, as populações seguintes tendem a ser melhores candidatos para a solução do problema do que as populações anteriores.

Um algoritmo genético pode parecer um tanto complexo, porém é possível dividi-lo em partes relativamente simples:

1.  Criação da população inicial (aleatória)

2.  Cálculo da função objetivo para todos os membros da população inicial e atualização do hall da fama

3.  Seleção dos indivíduos (quais seguem pra próxima geração)

4.  Cruzamento dos indivíduos selecionados (troca de material genético)

5.  Mutação dos indivíduos da população recém-criada (possibilidade de trazer informação nova ao sistema)

6.  Cálculo da função objetivo para todos os membros da população recém-criada e atualização do hall da fama

7.  Checar os critérios de parada. Caso os critérios não tenham sido atendidos, retornar ao passo 3

8.  Retornar para o usuário o hall da fama



## Glossário



-   `Indivíduo`: um candidato para a solução do problema

-   `População`: um conjunto de candidatos para a solução do problema

-   `Gene`: um parâmetro que pertence a um indivíduo

-   `Cromossomo` ou `genótipo`: um conjunto de genes

-   `Geração`: cada população em uma busca genética faz parte de uma geração. A primeira geração é geralmente formada por indivíduos aleatórios (sorteados dentro do espaço de busca). As gerações seguintes são formadas por seleção, cruzamento e mutação da geração anterior. Um dos critérios de parada possíveis para um algoritmo genético é o número máximo de gerações

-   `Função de aptidão` ou `função objetivo` ou `função fitness`: uma função que recebe um indivíduo e retorna o seu valor de aptidão. Em um problema de otimização, nós buscamos encontrar soluções que minimizam ou maximizam o valor de aptidão

-   `Seleção`: processo onde utilizamos o valor de aptidão dos indivíduos para selecionar quais irão passar seus genes para a geração seguinte

-   `Cruzamento`: processo onde o material genético de indivíduos selecionados é misturado

-   `Mutação`: processo onde os genes dos indivíduos selecionados têm uma chance de alterar seu valor. A mutação é o único processo capaz de introduzir informação nova ao pool genético após o sorteio aleatório da primeira geração

-   `Hall da fama`: conjunto dos $n$ indivíduos que obtiveram os melhores valores de aptidão durante o processo de busca



## Reflexões



Você diria que o algoritmo genético é determinístico ou probabilístico?
>Probabilístico, uma vez que se baseia na evolução Darwiniana e em crossing-over.

Será que um algoritmo genético é capaz de encontrar mínimos (ou máximos) da função objetivo?
>Estatisticamente é possível, mas em geral tudo depende de como funciona o critério de selção de indivíduos, além das probabilidades de cruzamento e mutações. Assim, depende dos parâmetros selecionados.

O que será que acontece quando não realizamos a etapa de mutação do algoritmo genético?
>Não há inserção de novas características que não são provenientes da geração 0. Assim, as chances de achar um indivíduo que seja o mais favorável para a situação diminui drasticamente (essencialmente depende da situação, então o "diminui drasticamente" pode não ser verdade).

O que será que acontece quando usamos uma chance de mutação muito alta?
>Em situações extremas, pode-se ter tanto uma mutação zero (o que diminui drasticamente a tendência de tentar achar o melhor indivíduo) ou uma mutação muito alta (o que quanto maior, mais próximo se torna de uma busca aleatória. Desse modo, não necessariamente é o mais otimizado e nem o melhor jeito de resolver algumas situações).



## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo genético. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Importações



In [1]:
import random
from funcoes import populacao_cb as cria_populacao_inicial
from funcoes import funcao_objetivo_pop_cb as funcao_objetivo_pop
from funcoes import selecao_roleta_max as funcao_selecao
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_cb as funcao_mutacao

## Códigos e discussão



In [2]:
#constantes
TAMANHO_POP = 6 #tamanho da populçãpo - (0 a 1)
NUM_GENES = 4 #número de genes - (int)
NUM_GERACOES = 5 #número de gerações; criterio de parada - (int)
CHANCE_CRUZAMENTO = 0.5 #chance de cruzamento - (0 a 1)
CHANCE_MUTACAO = 0.05 #chance de ocorrer uma mutação - (0 a 1)

In [3]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)
print("população inicial: ")
print(populacao)
    
for n in range(0,NUM_GERACOES,1):
    fitness = funcao_objetivo_pop(populacao) #gera o "fitness" de cada indivíduo
    populacao = funcao_selecao(populacao, fitness) #seleciona individuos baseado em "fitness"
    pais = populacao[0::2] #seleção de indivíduos "pais" por meio de corte de lista e passo 2
    maes = populacao[1::2] #seleção de indivíduos "mães" por meio de corte de lista e passo 2
    contador = 0 #para posição de pai e mãe. Talvez "pop" fosse mais eficiente?
    for pai, mae in zip(pais,maes): #o critério de parada de zip é a menor lista. aqui os tamanhos são iguais
        if random.random() <= CHANCE_CRUZAMENTO: #se (número aleatório) < chance de cruzamento
            #novos individuos
            filho1, filho2 = funcao_cruzamento(pai,mae) #filhos gerados do cruzamento
            populacao[contador] = filho1 #filho 1 substitui o "pai"
            populacao[contador + 1] = filho2 #filho 2 substitui a "mãe"
            
        contador += 2 #atualiza o contador para pegar outros pais
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO: #se (número aleatório) <= chance de ocorrer mutação
            individuo = populacao[n] #pega o indivíduo no índice "n" da população
            #print()
            #print(individuo)
            populacao[n] = funcao_mutacao(individuo) #aplica mutação no indivíduo
            #print(populacao[n]) #print no indivíduo com mutação
            #print()
            
print("população final: ")
print(populacao)



população inicial: 
[[0, 1, 1, 1], [1, 1, 0, 1], [1, 1, 1, 0], [0, 1, 1, 0], [1, 0, 1, 0], [0, 1, 0, 1]]
população final: 
[[1, 1, 1, 0], [0, 1, 0, 1], [0, 1, 1, 0], [0, 1, 1, 0], [0, 1, 1, 0], [0, 1, 1, 0]]


## Conclusão



Conseguiu-se resolver o probelma das caixas binárias com "n" candidados com algoritmos genéticos. Observou-se, através de várias rodadas, que este é um algoritmo probabilístico, pois o resultado obtido em várias rodadas foi diferente (os resultados variam de acordo com as constantes definidas, mas ainda sim o sistema de funcionamento é probabilístico). Assim, diferentes pessoas podem rodar o mesmo código e adquirir resultados discrepantes. Além disso, o algoritmo genético faz um tipo de "adaptação computacional" dos conceitos darwinianos para a seleção de indivíduos, o que significa que não é precisamente fidedigno, mas é inspirado.
Pôde-se concluir, também, que o notebook organizado em forma de script torna o código mais limpo e simples de ser lido.

## Playground

