Algoritmo genético
==================



## Introdução



`Algoritmos genéticos` são algoritmos inspirados na teoria da evolução de Darwin e são ferramentas poderosas para resolver problemas de otimização. De maneira simples, a estratégia consiste em gerar uma população inicial aleatória e através de seleção, cruzamento e mutação sucessivas, gerar populações seguintes. Se feito de maneira correta, as populações seguintes tendem a ser melhores candidatos para a solução do problema do que as populações anteriores.

Um algoritmo genético pode parecer um tanto complexo, porém é possível dividi-lo em partes relativamente simples:

1.  Criação da população inicial (aleatória)

2.  Cálculo da função objetivo para todos os membros da população inicial e atualização do hall da fama

3.  Seleção dos indivíduos (quais seguem pra próxima geração)

4.  Cruzamento dos indivíduos selecionados (troca de material genético)

5.  Mutação dos indivíduos da população recém-criada (possibilidade de trazer informação nova ao sistema)

6.  Cálculo da função objetivo para todos os membros da população recém-criada e atualização do hall da fama

7.  Checar os critérios de parada. Caso os critérios não tenham sido atendidos, retornar ao passo 3

8.  Retornar para o usuário o hall da fama



## Glossário



-   `Indivíduo`: um candidato para a solução do problema

-   `População`: um conjunto de candidatos para a solução do problema

-   `Gene`: um parâmetro que pertence a um indivíduo

-   `Cromossomo` ou `genótipo`: um conjunto de genes

-   `Geração`: cada população em uma busca genética faz parte de uma geração. A primeira geração é geralmente formada por indivíduos aleatórios (sorteados dentro do espaço de busca). As gerações seguintes são formadas por seleção, cruzamento e mutação da geração anterior. Um dos critérios de parada possíveis para um algoritmo genético é o número máximo de gerações

-   `Função de aptidão` ou `função objetivo` ou `função fitness`: uma função que recebe um indivíduo e retorna o seu valor de aptidão. Em um problema de otimização, nós buscamos encontrar soluções que minimizam ou maximizam o valor de aptidão

-   `Seleção`: processo onde utilizamos o valor de aptidão dos indivíduos para selecionar quais irão passar seus genes para a geração seguinte

-   `Cruzamento`: processo onde o material genético de indivíduos selecionados é misturado

-   `Mutação`: processo onde os genes dos indivíduos selecionados têm uma chance de alterar seu valor. A mutação é o único processo capaz de introduzir informação nova ao pool genético após o sorteio aleatório da primeira geração

-   `Hall da fama`: conjunto dos $n$ indivíduos que obtiveram os melhores valores de aptidão durante o processo de busca



## Reflexões



Você diria que o algoritmo genético é determinístico ou probabilístico?

Será que um algoritmo genético é capaz de encontrar mínimos (ou máximos) da função objetivo?

O que será que acontece quando não realizamos a etapa de mutação do algoritmo genético?

O que será que acontece quando usamos uma chance de mutação muito alta?



## Objetivo



Encontrar uma solução para o problema das caixas binárias usando o algoritmo genético. Considere 4 caixas.



## Descrição do problema



O problema das caixas binárias é simples: nós temos um certo número de caixas e cada uma pode conter um valor do conjunto $\{0, 1\}$. O objetivo é encontrar uma combinação de caixas onde a soma dos valores contidos dentro delas é máximo.



## Funções

In [25]:
def gene(q=2):
    '''Gera um gene válido para o problema das caixas binárias.
    
    Args:
        q: Number of possibilities by box.
    
    Return:
        Um valor zero ou um.
    '''
    #lista = [0, 1]
    #gene = random.choice(lista)
    #return gene
    
    import random
    
    return random.choice(range(q))

def chromossome(n, q=2):
    '''Gera um individuo para o problema das caixas binárias.
    
    Args:
        n: número de genes do indivíduo;
        q: Number of possibilities by box.
    
    Return:
        Uma lista com n genes. Cada gene é um valor zero ou um.
    '''
    #individuo = []
    #for i in range(n):
    #    gene = gene_cb()
    #    individuo.append(gene)
    #return gene

    return [gene(q=q) for i in range(n)]

def score(individuo):
    '''Computa a função objetivo no problema das caixas binárias.
    
    Args:
        individuo: lista contendo os genes das caixas binárias.
    
    Return:
        Um valor representando a soma dos genes do individuo.
    '''
    return sum(individuo)

def create_pop(n_chromossomes, n_genes, calc=True, p=False, q=2):
    '''Creates a population based on the number of wanted chromossomes and genes each one has.
    
    Args:
        n_chromossomes: Number of chromossomes wanted, or the size of the population;
        n_genes: Number of genes each individual or chromossome will have;
        calc: Deafult true and tells the func to calculate the objective function or not of each chromossome;
        p: Default true and tells the func to print the population of chromossomes;
        q: Number of possibilities by box.
    
    Returns:
        A dict containing all randomly generated chromossomes.
    '''
    #chro = {}    
    #for i in range(n_chromossomes):
    #    chro[i+1] = individuo_cb(n_genes)
    #return chro
    
    chro = {i+1: chromossome(n_genes,q=q) for i in range(n_chromossomes)}
    
    if calc:
        for key in chro:
            chro[key] = [chro[key], score(chro[key])]
    
    if p:
        for key in chro:
            if calc:
                print(f'Chromossome {key}:\n\tGenes: {chro[key][0]}\n\tScore: {chro[key][1]}')
            else:
                print(f'Chromossome {key}:\n\tGenes: {chro[key]}')
    
    return chro

def pop_score(pop):
    '''Calculates the score to the whole population passed.
    
    Args:
        pop: Dict with the population which score is wanted.
    
    Returns:
        Dict with same structure as before but with a list for the Chromossome, the second item being the score.
    '''
    for key in pop:
        pop[key] = [pop[key], score(pop[key])]
    return pop

def print_pop(pop, calc=True):
    '''Prints the population passed with indentation.
    
    Args:
        pop: Dict that contain population to print;
        calc: Tells the function if the score has already been calculated.
    '''
    for key in pop:
        if calc:
            print(f'Chromossome {key}:\n\tGenes: {pop[key][0]}\n\tScore: {pop[key][1]}')
        else:
            print(f'Chromossome {key}:\n\tGenes: {pop[key]}')
    return None

def select_parents(pop, p=False):
    '''Takes a population of chromossomes and returns a dict with the selected parents for the next generation.
    
    Args:
        pop: Dict with the population to filter the parents for the next generation (repeating or not);
        p: Tells to print the resulting list with indentation.
    
    Returns:
        List with the selected parents.
    '''
    import random
    
    sel = random.choices([pop[key][0] for key in pop], [pop[key][1] for key in pop], k=len(pop))
    
    aux_dict = {}
    if p:
        for chro in sel:
            if str(chro) in aux_dict:
                aux_dict[str(chro)] += 1
            else:
                aux_dict[str(chro)] = 1
        for key in aux_dict:
            print(f'Chromossomo {key}: {aux_dict[key]}')
    
    return sel

def single_point_cross(chro1, chro2):
    '''Single Point crossing over.
    
    Args:
        chro1: Parent chromossome 1;
        chro2: Parent chromossome 2.
    
    Returns:
        Child chromossomes 1 and 2.
    '''
    import random
    
    n_gene = len(chro1)
    k = random.randint(0,n_gene-1)
    
    aux1 = []
    aux2 = []
    
    for i in range(n_gene):
        if i < k:
            aux1.append(chro1[i])
            aux2.append(chro2[i])
        else:
            aux1.append(chro2[i])
            aux2.append(chro1[i])
    
    return aux1, aux2, k

def crossover(sel, func=single_point_cross, chance=.5, calc=True, p=False, debug=False):
    '''Makes the crossing over of the selected parents for the next generation.
    
    Args:
        sel: A list with the selected parents for the next gen;
        func: Function to uso as base to make the crossover;
        chance: The chance to have a crossover between parents;
        calc: Calculate or not the scores for each chromossome;
        p: Tell the function to print the results;
        debug: Tells the function to show all crossovers that happened and what changed.
    
    Returns:
        A list with the new generation of chromossomes.
    '''
    import random
    
    def pairwise(iterable):
        "s -> (s0, s1), (s2, s3), (s4, s5), ..."
        a = iter(iterable)
        return zip(a, a)
    
    i = 1
    crossed = {}
    for chro1, chro2 in pairwise(sel):
        if random.random() < chance:
            child1, child2, k = func(chro1, chro2)
            
            if calc:
                crossed[i] = [child1, score(child1)]
                crossed[i+1] = [child2, score(child2)]
            else:
                crossed[i] = child1
                crossed[i+1] = child2
            
            if debug:
                print(f'Parent 1: {chro1} / Parent 2: {chro2}\nChild 1: {child1} / Child 2: {child2}\t{k}\n')
        else:
            if calc:
                crossed[i] = [chro1, score(chro1)]
                crossed[i+1] = [chro2, score(chro2)]
            else:
                crossed[i] = chro1
                crossed[i+1] = chro2
        i += 2
    
    if p:
        print_pop(crossed, calc=calc)
    return crossed

def mutation(chro, func=gene, chance=.05, p=False, q=2):
    '''Makes random mutations on each gene with small chance for the chromossome.
    
    Args:
        chro: Chromossome to be mutated (or not);
        func: Base function that makes the mutation;
        chance: Chance that each gene will be mutated;
        p: Tells to print or not the new chromossome;
        q: Number of possibilities by box.
    
    Returns:
        A chromossome that passed through the mutation or not.
    '''
    import random, copy
    
    aux = copy.deepcopy(chro)
    
    for i, gene in enumerate(chro):
        if random.random() < chance:
            aux[i] = func(q=q)
    
    if p:
        print(f'Old Chromossome: {chro} / New Chromossome: {aux}')
    
    return aux

def mutation_pop(pop, func=gene, chance=.05, p=False, p_m=False, q=2):
    '''Make the whole population pass through the random chance mutation process.
    
    Args:
        pop: Population of chromossomes to be mutated (or not);
        func: Base function that makes the mutation;
        chance: Chance that each gene will be mutated;
        p: Tells to print or not the new population;
        p_m: Tells to print the individual chromossome mutations;
        q: Number of possibilities by box.
    
    Returns:
        A population that passed through the mutation or not.
    '''
    import copy
    
    aux = copy.deepcopy(pop)
    
    for key in pop:
        aux[key][0] = mutation(pop[key][0], func=func, chance=chance, p=p_m, q=q)
        aux[key][1] = score(aux[key][0])
    
    return aux

def whole_process(n_gen, n_chro, n_gene, p=True, q=2, cross=.5, mut=.05):
    '''Makes the whole process of the genetic algorithm for the boxes problem
    
    Args:
        n_gen: Number of generations to process;
        n_chro: Number of chromossomes per generation;
        n_gene: Number of genes fo each chromossome (boxes);
        p: Tells the function to print the result;
        q: Number of possibilities by box.
    
    Returns:
        A dict with all the generations made by the program.
    '''
    final_dict = {f'Generation {i+1}': {} for i in range(n_gen)}
    ini_pop = create_pop(n_chro, n_gene, q=q)
    
    for key in ini_pop:
        final_dict['Generation 1'][f'Chromossome {key}'] = ini_pop[key]
    
    for i in range(2,n_gen+1):
        parents = select_parents(final_dict[f'Generation {i-1}'])
        semi_gen = crossover(parents, chance=cross)
        next_gen = mutation_pop(semi_gen, q=q, chance=mut)
        for key in next_gen:
            final_dict[f'Generation {i}'][f'Chromossome {key}'] = next_gen[key]
            
    if p:
        for gen in final_dict:
            print(f'{gen}:')
            for chro in final_dict[gen]:
                print(f'\t{chro}:\n\t\tGene: {final_dict[gen][chro][0]}\n\t\tScore: {final_dict[gen][chro][1]}')
            print()
            
    return final_dict

## Códigos e discussão



In [30]:
n_geracoes = 10
n_individuos = 4
n_caixas = 4

In [32]:
finish = whole_process(n_geracoes, n_individuos, n_caixas, q=2, cross=.8, mut=.05)

Generation 1:
	Chromossome 1:
		Gene: [0, 1, 0, 1]
		Score: 2
	Chromossome 2:
		Gene: [0, 1, 0, 1]
		Score: 2
	Chromossome 3:
		Gene: [1, 0, 1, 1]
		Score: 3
	Chromossome 4:
		Gene: [0, 0, 1, 1]
		Score: 2

Generation 2:
	Chromossome 1:
		Gene: [1, 0, 1, 1]
		Score: 3
	Chromossome 2:
		Gene: [0, 1, 0, 1]
		Score: 2
	Chromossome 3:
		Gene: [1, 0, 1, 1]
		Score: 3
	Chromossome 4:
		Gene: [1, 0, 1, 1]
		Score: 3

Generation 3:
	Chromossome 1:
		Gene: [0, 1, 0, 0]
		Score: 1
	Chromossome 2:
		Gene: [1, 0, 1, 1]
		Score: 3
	Chromossome 3:
		Gene: [1, 0, 1, 1]
		Score: 3
	Chromossome 4:
		Gene: [1, 1, 1, 1]
		Score: 4

Generation 4:
	Chromossome 1:
		Gene: [1, 1, 1, 1]
		Score: 4
	Chromossome 2:
		Gene: [1, 1, 1, 1]
		Score: 4
	Chromossome 3:
		Gene: [1, 1, 1, 0]
		Score: 3
	Chromossome 4:
		Gene: [1, 1, 1, 1]
		Score: 4

Generation 5:
	Chromossome 1:
		Gene: [1, 1, 1, 1]
		Score: 4
	Chromossome 2:
		Gene: [1, 1, 1, 1]
		Score: 4
	Chromossome 3:
		Gene: [1, 1, 1, 1]
		Score: 4
	Chromossome 4

## Conclusão

### Você diria que o algoritmo genético é determinístico ou probabilístico?
O algoritmo genético é probabilistico, pois o crescimento e desenvolvimento de cada uma das populações é dada de maneira probabilistica, sendo necessária várias etapas de calculos com resultados não determinístico, como por exemplo o cruzamento entre indivíduos para criação de novos indivíduos e a probabilidade de uma mutação aleatória para aumentar a diversidade genética da população.

### Será que um algoritmo genético é capaz de encontrar mínimos (ou máximos) da função objetivo?
Ao se utilizar um algoritmo genético é possível encontrar os mínimos e máximos de uma função, sendo necessária a iteração de várias das etapas do processo, e caso seja feito de maneira certa, o aloritmo é capaz de chegar cada vez mais perto aos máximos (ou mínimos) da função, globais ou não.

### O que será que acontece quando não realizamos a etapa de mutação do algoritmo genético?
O que pode acontecer é uma tendência de todos os indivíduos tenderem à um máximo (ou mínimo) local, podendo este ser global ou não. Isto demonstraria uma baixa variabilidade genética dentro da população, oque poderá dificultar a procura de pontos interessantes da função objetivo e ao mesmo limitando a busca do algoritmo dentro espaço de busca.

### O que será que acontece quando usamos uma chance de mutação muito alta?
O que pode acontecer a não cuminação da população para nenhum ponto em comum, pois quando se aumenta muito a probabilidade de mutação dos indivíduos, a tendencia será uma grande variabilidade genética dentro da população, não resultando na tendencia a um ponto em comum, mas para a dispersão da população dentro do espaço de busca e consequentemente da função objetivo.

## Playground

