Descobrindo a senha
===================



## Objetivo



Usar um algoritmo genético para descobrir uma senha.



## Descrição do problema



Neste problema, a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução (veja que isso é algo que não temos no mundo real. Nenhum site irá te dizer se você está acertando ou errando seu palpite). O critério de parada deste problema é quando a senha for descoberta.



## Importações



In [1]:
from funcoes import populacao_inicial_senha
from funcoes import funcao_objetivo_pop_senha
from funcoes import selecao_torneio_min
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_senha
import random

## Códigos e discussão



In [2]:
# constantes gerais
TAMANHO_POP = 50
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05
NUM_COMBATENTES_NO_TORNEIO = 3

# constantes específicas
SENHA = "correcthorsebatterystaple"
LETRAS_POSSIVEIS = "abcdefghijklmnopqrstuvwxyz"
NUM_GENES = len(SENHA)

Nós readequamos as funções para facilitar a escrita, a leitura do código e a inserção dos argumentos específicos para este caso:

In [3]:
# funções locais
def cria_populacao_inicial(tamanho, tamanho_senha):
    return populacao_inicial_senha(tamanho, tamanho_senha, LETRAS_POSSIVEIS)

def funcao_objetivo_pop(populacao):
    return funcao_objetivo_pop_senha(populacao, SENHA)

def funcao_selecao(populacao, fitness):
    return selecao_torneio_min(populacao, fitness, NUM_COMBATENTES_NO_TORNEIO)

def funcao_mutacao(individuo):
    return mutacao_senha(individuo, LETRAS_POSSIVEIS)

Aqui, o *fitness* é aproximado do ideal por cima (infinito positivo), pois quando se igualar a zero significará que a distância entre o indivíduo gerado e a senha verdadeira é 0.

In [4]:
# geração da população

populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

melhor_fitness_ja_visto = float("inf")  # é assim que escrevemos infinito em python

print("Progresso da melhor senha já vista:")

while melhor_fitness_ja_visto != 0:   
    
    # Seleção
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    # Cruzamento
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        
        contador = contador + 2   
        
    # Mutação
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)            
            
    # melhor individuo já visto até agora
    fitness = funcao_objetivo_pop(populacao)
    menor_fitness = min(fitness)
    if menor_fitness < melhor_fitness_ja_visto:        
        posicao = fitness.index(menor_fitness)
        melhor_individuo_ja_visto = populacao[posicao].copy()
        melhor_fitness_ja_visto = menor_fitness
        print("".join(melhor_individuo_ja_visto), "- fitness:", melhor_fitness_ja_visto)

Progresso da melhor senha já vista:
bhrpccralgpejokfxpqowaxvt - fitness: 152
bhrpccralgpejokfxpqowaxmd - fitness: 129
bhrpccralzovhknsfkrjtkvsd - fitness: 124
bhrpccralzovhknsfkrjtkmsd - fitness: 121
gmsuicrcavuabwopbwqewalmd - fitness: 115
bhrpccujmujrecflqoxxuclmd - fitness: 99
bhrpccrjmujreknsfkrowaxmd - fitness: 95
bhrpccrjmujreknsfkxxuclmd - fitness: 86
bhrpccujmuuablopbkrowaxmd - fitness: 80
bhrpccujmuuabcopbkrowaxmd - fitness: 71
bhrpccujmuuablosfkxxuclmd - fitness: 66
bhrpccujmuuablopfrxxuclmd - fitness: 62
bhrpccujmuuaecnsfrxxuclmd - fitness: 54
bhrpccujmuuaectsfrxxuclmd - fitness: 48
bhrpccujmuuaecttfrxxuclmd - fitness: 47
bmrpccujmuuaectsfrxxuclmd - fitness: 43
bmrpccujmuuaecttfrxxuclmd - fitness: 42
bmrpccujmutaecttfrxxuclmd - fitness: 41
bmrsccujmutaecttfrxxuclmd - fitness: 40
bmrsccujmutaecttfrxruclmd - fitness: 36
bmrscctjmutaecttfrxruclmd - fitness: 35
bmrscctjoutaecttfrxruclmd - fitness: 33
bprscctjoutaebttfrxruclmd - fitness: 31
bprscctjoutaebttfrxruclld - fitness: 30

In [5]:
print()
print("Melhor palpite da senha encontrado:")
print("".join(melhor_individuo_ja_visto))


Melhor palpite da senha encontrado:
correcthorsebatterystaple


## Conclusão



Abordamos o problema de descobrir a senha a partir de um algoritmo de minimização, que possui uma implementação bastante semelhante ao de maximização. Por isso, esse experiemento foi mais uma progressão baseada na adaptação do código anterior. A diferença da minimização nesse caso se dá na aproximação por cima, pois o limite de distância = 0 é melhor definido.

Apesar de virtualmente nunca seguir o mesmo caminho, o algoritmo sempre chega ao resultado correto com pouca variação no número de tentativas ou do *score* inicial. É interessante notar, também, como os *scores* de *fitness* vão afunilando conforme as gerações (na maioria das vezes que rodei, os primeiros apresentaram uma diferença entre 10 a 30 pontos, enquanto os dez finalistas sempre são sequenciais).

## Playground

