Algoritmo genético
==================



## Introdução



`Algoritmos genéticos` são algoritmos inspirados na teoria da evolução de Darwin e são ferramentas poderosas para resolver problemas de otimização. De maneira simples, a estratégia consiste em gerar uma população inicial aleatória e através de seleção, cruzamento e mutação sucessivas, gerar populações seguintes. Se feito de maneira correta, as populações seguintes tendem a ser melhores candidatos para a solução do problema do que as populações anteriores.

Um algoritmo genético pode parecer um tanto complexo, porém é possível dividi-lo em partes relativamente simples:

1.  Criação da população inicial (aleatória)

2.  Cálculo da função objetivo para todos os membros da população inicial e atualização do hall da fama

3.  Seleção dos indivíduos (quais seguem pra próxima geração)

4.  Cruzamento dos indivíduos selecionados (troca de material genético)

5.  Mutação dos indivíduos da população recém-criada (possibilidade de trazer informação nova ao sistema)

6.  Cálculo da função objetivo para todos os membros da população recém-criada e atualização do hall da fama

7.  Checar os critérios de parada. Caso os critérios não tenham sido atendidos, retornar ao passo 3

8.  Retornar para o usuário o hall da fama



## Glossário



-   `Indivíduo`: um candidato para a solução do problema

-   `População`: um conjunto de candidatos para a solução do problema

-   `Gene`: um parâmetro que pertence a um indivíduo

-   `Cromossomo` ou `genótipo`: um conjunto de genes

-   `Geração`: cada população em uma busca genética faz parte de uma geração. A primeira geração é geralmente formada por indivíduos aleatórios (sorteados dentro do espaço de busca). As gerações seguintes são formadas por seleção, cruzamento e mutação da geração anterior. Um dos critérios de parada possíveis para um algoritmo genético é o número máximo de gerações

-   `Função de aptidão` ou `função objetivo` ou `função fitness`: uma função que recebe um indivíduo e retorna o seu valor de aptidão. Em um problema de otimização, nós buscamos encontrar soluções que minimizam ou maximizam o valor de aptidão

-   `Seleção`: processo onde utilizamos o valor de aptidão dos indivíduos para selecionar quais irão passar seus genes para a geração seguinte

-   `Cruzamento`: processo onde o material genético de indivíduos selecionados é misturado

-   `Mutação`: processo onde os genes dos indivíduos selecionados têm uma chance de alterar seu valor. A mutação é o único processo capaz de introduzir informação nova ao pool genético após o sorteio aleatório da primeira geração

-   `Hall da fama`: conjunto dos $n$ indivíduos que obtiveram os melhores valores de aptidão durante o processo de busca



## Reflexões



Você diria que o algoritmo genético é determinístico ou probabilístico?

Será que um algoritmo genético é capaz de encontrar mínimos (ou máximos) da função objetivo?

O que será que acontece quando não realizamos a etapa de mutação do algoritmo genético?

O que será que acontece quando usamos uma chance de mutação muito alta?



## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo genético. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Importações



In [3]:
# primeira coisa a ser feita!
# código não roda se você precisar de algo externo mas não tiver importado

#from funcoes import gene_cb

from funcoes import populacao_cb as cria_pop_ini 
#estamos chamando X função, mas aqui ela chamará Y
#a renomeação acontece na hora de importar, então aqui dentro precisamos chamar "cria_pop_ini"
from funcoes import selecao_roleta_maxima as roleta_max # função da roleta
from funcoes import funcao_objetivo_populacao_cb as fobj_populacao_cb # função objetivo 

# nomes no notebook são mais genéricas
# nomes no arquivo são mais descritivos (lá, quanto mais descritivos, melhor)

## Códigos e discussão



In [4]:
# lembrar das funções com strings
# essa proposta me lembra das atividades da aula passada
# dica de ouro do Dani: antes, descrever o que o código precisa fazer e, depois, traduzir computacionalmente 
# sendo assim, vamos lá:

# queremos um resultado que nos ofereça o MÁXIMO possível 
# o resultado é dado pela combinação dos valores das caixas
# novamente, trabalharemos com caixas binárias

# temos 4 Caixas (ou 4 Genes)
# um conjunto de 4 caixas compõe um indivíduo/candidato
NUM_CG = 4

# cada uma dessas caixas pode assumir dois valores: ou zero ou 1
# precisaremos de uma função que retorne o valor desses genes
# já fizemos uma no experimento 1!
# já importei também

## Conclusão
#### Questões para reflexão
> O Algoritmo Genético é probabilísitco. Digo isso já com antecedência porque estava na leitura recomendada pelo professor (probabilistic behavior), mas, depois da realização dos experimentos, virei aqui para justificar com o exemplo prático. 

> Além disso, ele também é sim capaz de encontrar os valores máximos de uma função objetivo. É justamente isso que ele busca fazer ao dar origem a diferentes gerações: ele quer o melhor valor possível. Caso o problema queira encontrar o valor mínimo, é necessário então multiplicar os valores encontrados para a função objetivo de cada um dos indivíduos por menos 1. Ou seja, ele também consegue enconrar os mínimos.

> A etapa de mutação (o último operador do ciclo) permite que Se não realizamos a mutação, corre-se o risco de que as gerações seguintes fiquem estagnadas em um mesmo valor 'ótimo' (o fitness). Isso é um problema porque o objetivo de testar diferentes gerações é justamente maximizar os resultados com diversidade de indivíduos.

> Contudo, se a chance de acontecer mutação for muito alta e mutações demais acontecerem, é perigoso que um bom indivíduo seja alterado e, consequentemente, sua performance acaba sendo influenciada negativamente. Além disso, o algoritmo acaba adquirindo também um caráter de aleatoriedade.

#### Sobre o experimento

<hr>

## Playground



- the art of solving problems using genetic algorithms: "Genetic algorithms provide us with a powerful and versatile tool that can be used to solve a wide array of problems and tasks."

#### Anotações
Não conseguimos definir o que é bom ou ruim antes de rodar o código
<br>Mas conseguimos limitar quantas vezes uma coisa vai acontecer (tipo quantas vezes vai acontecer mutação)
<br>Aleatoriedade está no coração dos algoritmos genéticos (pergunta da Dani!!!! coisa mais linda)
<br>Lembrar de definir os critérios de parada
<br>Gostaria que ficasse claro que AG são muito muito versáteis: cabe explorar a criatividade e criar situações, mesmo que na genética 
<br>Se o valor usado em for não for importante no código, você não coloca uma letra, você coloca '_' e isso indica para o usuário que não é uma informação importante
<br>Focar em cada função, desenvolvê-las e depois se preocupar com os elementos externos

In [None]:
# Código Dani
# funções swrão escritas diretamente no funcao.py
# só operadores de seleção 

#constantes
TAMANHO_POP = 5
NUM_GENES = 4
NUM_GERACOES = 57

populacao = cria_pop_ini(TAMANHO_POP, NUM_GENES)
print(populacao)

for n in range(NUM_GERACOES):
    fitness = fobj_populacao_cb(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
print(populacao)
    