Descobrindo a senha
===================



## Objetivo



Usar um algoritmo genético para descobrir uma senha.



## Descrição do problema



Neste problema, a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução (veja que isso é algo que não temos no mundo real. Nenhum site irá te dizer se você está acertando ou errando seu palpite). O critério de parada deste problema é quando a senha for descoberta.



## Importações



In [1]:
from funcoes import populacao_inicial_senha
from funcoes import funcao_objetivo_pop_senha
from funcoes import selecao_torneio_min
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_senha
import random

## Códigos e discussão



In [2]:
### CONSTANTES

# relacionadas à busca
TAMANHO_POP = 50
NUM_GERACOES = 2000
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05
NUM_COMBATENTES_NO_TORNEIO = 3

# relacionadas ao problema a ser resulvido
SENHA = "correcthorsebatterystaple"
LETRAS_POSSIVEIS = "abcdefghijklmnopqrstuvwxyz"
NUM_GENES = len(SENHA)

In [3]:
# funções locais

def cria_populacao_inicial(tamanho, tamanho_senha):
    return populacao_inicial_senha(tamanho, tamanho_senha, LETRAS_POSSIVEIS)

def funcao_objetivo_pop(populacao):
    return funcao_objetivo_pop_senha(populacao, SENHA)

def funcao_selecao(populacao, fitness):
    return selecao_torneio_min(populacao, fitness, NUM_COMBATENTES_NO_TORNEIO)

def funcao_mutacao(individuo):
    return mutacao_senha(individuo, LETRAS_POSSIVEIS)

In [4]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

melhor_fitness_ja_visto = float("inf")  # é assim que escrevemos infinito em python

print("Progresso da melhor senha já vista:")

for n in range(NUM_GERACOES):    
    
    # Seleção
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    # Cruzamento
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        
        contador = contador + 2   
        
    # Mutação
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)            
            
    # melhor individuo já visto até agora
    fitness = funcao_objetivo_pop(populacao)
    menor_fitness = min(fitness)
    if menor_fitness < melhor_fitness_ja_visto:        
        posicao = fitness.index(menor_fitness)
        melhor_individuo_ja_visto = populacao[posicao]
        melhor_fitness_ja_visto = menor_fitness
        print("".join(melhor_individuo_ja_visto), "- fitness:", melhor_fitness_ja_visto)

print()
print("Melhor palpite da senha encontrado:")
print("".join(melhor_individuo_ja_visto))


Progresso da melhor senha já vista:
amnisashisjlimidauyyohpds - fitness: 150
amnisashisjlimidauyyohpdg - fitness: 138
ylfeefxtnqtahbysmotrwekkp - fitness: 130
alrkkcuczixnayuuauyrldgzg - fitness: 129
hgovonxtnqtahbysmotrwekkp - fitness: 118
alrkkcxtnqtahbysmotrwekkp - fitness: 95
alrkkcucnqtahbysmotrwekkp - fitness: 85
alrkkcuczqtahbuuauyrwekkp - fitness: 82
alrkkcucnqtahbysmotrwekke - fitness: 74
alrkkcucnqtnabyskotrwekke - fitness: 72
alrkkcucnqtnabysmuyywepke - fitness: 69
alrkkcucnqtnabysmuyrwepke - fitness: 64
alrkkcucnqtaabysmotrwcpke - fitness: 62
alrkkcucnqtaabysmoxrwcpke - fitness: 58
alrkkcucnqtaabysmuyrwcpke - fitness: 57
alrkkcuinqtaabysmoxrwcpke - fitness: 54
alrkkcuinqtaabysmuyrwcpke - fitness: 53
alrkecuinqtaabysmuyrwcpke - fitness: 47
aorkecuinqtaabysmuyrwcpke - fitness: 44
alrkecuinqtaabysauyrwcpke - fitness: 43
aorkecuinqtaabysauyrwcpke - fitness: 40
aorkecuinqtaabssauyrwcpke - fitness: 36
aoruecuinqtaabssauyrwcpke - fitness: 32
aoruecuinqtaabssaryrwcpke - fitness: 29

## Conclusão

Esse experimento foi o mais trabalhoso que teve até agora, sendo até a premissa do problema muito mais complexo do que dos experimentos anteriores. O interessante dele, na minha opinião, é que conseguimos avaliar uma distância entre os indivíduos (senhas testadas) com a senha real, e fazemos isso ordenando os caracteres com números. Dessa maneira, transformamos o problema de comparar distância de letras para comparar a distância com números. Isso é super útil no que tange programação com problemas que envolvem sentenças e palavras com letras. Esse código, por ser um problema de algorítmo genético, também é probabilistico.
Outra coisa importante que aprendemos foi a função de rodeio, a qual compara todos os indivíduos para definir realmente os mais promissores e os piores candidatos. Com isso, podemos cruzar os melhores candidatos de maneira a buscar a solução de maneira mais eficiente.

## Playground

