Descobrindo a senha
===================



## Objetivo



Usar um algoritmo genético para descobrir uma senha.



## Descrição do problema



Neste problema, a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução (veja que isso é algo que não temos no mundo real. Nenhum site irá te dizer se você está acertando ou errando seu palpite). O critério de parada deste problema é quando a senha for descoberta.

## Importações



In [1]:
from funcoes import populacao_inicial_senha
from funcoes import funcao_objetivo_pop_senha
from funcoes import selecao_torneio_min
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_senha
import random as rd

## Códigos e discussão



In [2]:
### CONSTANTES

# relacionadas à busca
TAMANHO_POP = 50
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05
NUM_COMBATENTES_NO_TORNEIO = 3

# relacionadas ao problema a ser resulvido
SENHA = "correcthorsebatterystaple"
LETRAS_POSSIVEIS = "abcdefghijklmnopqrstuvwxyz"
NUM_GENES = len(SENHA)

In [3]:
# funções locais (para não ter que colocar as variaveis locais no script)

def cria_populacao_inicial(tamanho, tamanho_senha):
    return populacao_inicial_senha(tamanho, tamanho_senha, LETRAS_POSSIVEIS)

def funcao_objetivo_pop(populacao):
    return funcao_objetivo_pop_senha(populacao, SENHA)

def funcao_selecao(populacao, fitness):
    return selecao_torneio_min(populacao, fitness, NUM_COMBATENTES_NO_TORNEIO)

def funcao_mutacao(individuo):
    return mutacao_senha(individuo, LETRAS_POSSIVEIS)

Com o propósito de transformar a senha em números para comparação, utilizamos a função ord, que associa um valor único a cada caractere. Dessa forma conseguimos definir uma função objetivo que quantifica a "diferença" entre a senha candidato para a senha correta. Além disso, criamos uma mutação que simplesmente troca uma letra por outra, dentre as letras possíveis, e uma função cruzamento que divide duas senhas em algum ponto e junta-as para formar dois novos indivíduos. Para selecionar os melhores indivíduos, utilizamos uma função de "torneio", que sorteia n indivíduos e pega somente o melhor.

In [4]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

melhor_fitness_ja_visto = float("inf")  # é assim que escrevemos infinito em python

print("Progresso da melhor senha já vista:")

numero_geracoes = 0

while melhor_fitness_ja_visto != 0:
    
    # Seleção
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    # Cruzamento
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if rd.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        
        contador = contador + 2   
        
    # Mutação
    for n in range(len(populacao)):
        if rd.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)            
            
    # melhor individuo já visto até agora
    fitness = funcao_objetivo_pop(populacao)
    menor_fitness = min(fitness)
    if menor_fitness < melhor_fitness_ja_visto:        
        posicao = fitness.index(menor_fitness)
        melhor_individuo_ja_visto = populacao[posicao]
        melhor_fitness_ja_visto = menor_fitness
        print("".join(melhor_individuo_ja_visto), "- fitness:", melhor_fitness_ja_visto)
    
    numero_geracoes = numero_geracoes + 1

print()
print("Melhor palpite da senha encontrado:")
print("".join(melhor_individuo_ja_visto))
print()
print(f'Para acertar a senha levou {numero_geracoes} gerações.')

Progresso da melhor senha já vista:
qarnpgxgjiqlaxtveuxftemmv - fitness: 143
dxrnpgxgjiqlaxtveuxftemmv - fitness: 125
dernpgxgjiqllmoveuxftemme - fitness: 112
eipllctgjiqlaxtveuxftemme - fitness: 98
eipllctmoiqlaxtveuxftemme - fitness: 97
eipllctgjiqlactveuxftemme - fitness: 77
eipllctgjiqlactveuxfteome - fitness: 75
eipllctmouwpactveuxfteome - fitness: 74
eipllctgouwpactveuxfteome - fitness: 70
eisllctgouwpactveuxfteome - fitness: 69
eipllctgouwnactveuxfteome - fitness: 68
empllctgouwnactveuxfteome - fitness: 64
empllctgouwnactvepxfteome - fitness: 63
empllctgouwnactvepxmteome - fitness: 56
empplctgouwnactvepxmteoje - fitness: 53
empplctgouwnactvepxmteome - fitness: 52
emrplctgouwnactvepxmteome - fitness: 50
emrplctgouwnactvepxwteome - fitness: 48
emrplctgouwdactvepxmteome - fitness: 42
emrplctgouwdactvepxwteome - fitness: 40
emrpactgouwdactvepxwteome - fitness: 37
emrpactgouwdacttepxwteome - fitness: 35
emrpactgouwdacttepxpteome - fitness: 34
emrpactgoutdacttepxpteome - fitness: 31
e

## Conclusão



Concluo que o algoritmo é muito eficiente para encontrar uma senha, já que em todas as vezes que rodei o experimento ele chegou exatamente no mínimo da função, que é a senha exata. Dessa vez acrescentamos o "hall da fama", que nos permite olhar para os melhores indivíduos já vistos, ao invés de toda a população, e isso tornou o algoritmo muito melhor em termos de encontrar a senha correta de maneira exata.