Algoritmo genético
==================



## Introdução



`Algoritmos genéticos` são algoritmos inspirados na teoria da evolução de Darwin e são ferramentas poderosas para resolver problemas de otimização. De maneira simples, a estratégia consiste em gerar uma população inicial aleatória e através de seleção, cruzamento e mutação sucessivas, gerar populações seguintes. Se feito de maneira correta, as populações seguintes tendem a ser melhores candidatos para a solução do problema do que as populações anteriores.

Um algoritmo genético pode parecer um tanto complexo, porém é possível dividi-lo em partes relativamente simples:

1.  Criação da população inicial (aleatória)

2.  Cálculo da função objetivo para todos os membros da população inicial e atualização do hall da fama

3.  Seleção dos indivíduos (quais seguem pra próxima geração)

4.  Cruzamento dos indivíduos selecionados (troca de material genético)

5.  Mutação dos indivíduos da população recém-criada (possibilidade de trazer informação nova ao sistema)

6.  Cálculo da função objetivo para todos os membros da população recém-criada e atualização do hall da fama

7.  Checar os critérios de parada. Caso os critérios não tenham sido atendidos, retornar ao passo 3

8.  Retornar para o usuário o hall da fama



## Glossário



-   `Indivíduo`: um candidato para a solução do problema

-   `População`: um conjunto de candidatos para a solução do problema

-   `Gene`: um parâmetro que pertence a um indivíduo

-   `Cromossomo` ou `genótipo`: um conjunto de genes

-   `Geração`: cada população em uma busca genética faz parte de uma geração. A primeira geração é geralmente formada por indivíduos aleatórios (sorteados dentro do espaço de busca). As gerações seguintes são formadas por seleção, cruzamento e mutação da geração anterior. Um dos critérios de parada possíveis para um algoritmo genético é o número máximo de gerações

-   `Função de aptidão` ou `função objetivo` ou `função fitness`: uma função que recebe um indivíduo e retorna o seu valor de aptidão. Em um problema de otimização, nós buscamos encontrar soluções que minimizam ou maximizam o valor de aptidão

-   `Seleção`: processo onde utilizamos o valor de aptidão dos indivíduos para selecionar quais irão passar seus genes para a geração seguinte

-   `Cruzamento`: processo onde o material genético de indivíduos selecionados é misturado

-   `Mutação`: processo onde os genes dos indivíduos selecionados têm uma chance de alterar seu valor. A mutação é o único processo capaz de introduzir informação nova ao pool genético após o sorteio aleatório da primeira geração

-   `Hall da fama`: conjunto dos $n$ indivíduos que obtiveram os melhores valores de aptidão durante o processo de busca



## Reflexões



Você diria que o algoritmo genético é determinístico ou probabilístico?

Será que um algoritmo genético é capaz de encontrar mínimos (ou máximos) da função objetivo?

O que será que acontece quando não realizamos a etapa de mutação do algoritmo genético?

O que será que acontece quando usamos uma chance de mutação muito alta?



## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo genético. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Importações



In [1]:
from funcoes import fitness, mutation_cb, new_pop_cb, roull_sel_max, crossover

## Códigos e discussão



In [2]:
TAM_CROMO = 4
TAM_POP = 10
NUM_GEN = 1000
PM = 0.05 # Probabilidade de mutação
PC = 0.5 # Probabilidade de cruzamento

In [3]:
gen = 1
pop = new_pop_cb(TAM_POP, TAM_CROMO)
while gen <= NUM_GEN:
    print("gen ", gen, ":", sep="")
    if gen > 1:
        pop = roull_sel_max(pop)

        pop_inds = [pop[i]["ind"] for i in pop]
        p1_list = pop_inds[0::2]
        p2_list = pop_inds[1::2]
        c = 1
        for p1, p2 in zip(p1_list, p2_list):
            filho1, filho2 = crossover(p1, p2, PC)
            pop[c]["ind"] = filho1
            pop[c + 1]["ind"] = filho2
            c += 2
    for i in pop:
        curr_ind = pop[i]
        if gen > 1:
            curr_ind = mutation_cb(curr_ind, PM)
        curr_ind["sum"] = fitness(curr_ind["ind"])
        print("\t", curr_ind)
    gen += 1
    print()

gen 1:
	 {'tag': 1, 'ind': [1, 1, 1, 1], 'sum': 4}
	 {'tag': 2, 'ind': [1, 0, 0, 0], 'sum': 1}
	 {'tag': 3, 'ind': [0, 1, 0, 1], 'sum': 2}
	 {'tag': 4, 'ind': [0, 1, 0, 1], 'sum': 2}
	 {'tag': 5, 'ind': [0, 1, 1, 1], 'sum': 3}
	 {'tag': 6, 'ind': [1, 1, 0, 0], 'sum': 2}
	 {'tag': 7, 'ind': [1, 1, 1, 0], 'sum': 3}
	 {'tag': 8, 'ind': [0, 0, 1, 1], 'sum': 2}
	 {'tag': 9, 'ind': [1, 1, 1, 0], 'sum': 3}
	 {'tag': 10, 'ind': [0, 1, 1, 1], 'sum': 3}

gen 2:
sel inds: [[1, 1, 1, 0], [1, 1, 1, 1], [0, 1, 0, 1], [0, 1, 0, 1], [0, 1, 1, 1], [1, 1, 1, 0], [1, 1, 1, 1], [1, 1, 1, 0], [0, 1, 1, 1], [1, 1, 1, 0]]
crossover between [1, 1, 1, 0] and [1, 1, 1, 1] done.
crossover between [0, 1, 0, 1] and [0, 1, 0, 1] done.
Crossover failed.
Crossover failed.
crossover between [0, 1, 1, 1] and [1, 1, 1, 0] done.
Mutation in gen 1 in 1 with mut= 0.029422264563511713
	 {'tag': 1, 'ind': [0, 1, 1, 1], 'sum': 3}
	 {'tag': 2, 'ind': [1, 1, 1, 0], 'sum': 3}
	 {'tag': 3, 'ind': [0, 1, 0, 1], 'sum': 2}
	 {'tag':

## Conclusão



A aplicação de um algorítmo genético propriamente dita faz muito sentido. Alterações genéticas ocorrem afim de maximizar, nesse caso, a resposta da função objetivo.

## Playground

