Descobrindo a senha
===================



## Objetivo



Usar um algoritmo genético para descobrir uma senha.



---------

## Descrição do problema



Neste problema, a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução (veja que isso é algo que não temos no mundo real. Nenhum site irá te dizer se você está acertando ou errando seu palpite). O critério de parada deste problema é quando a senha for descoberta.



-----

## Importações



In [1]:
from funcoes import populacao_inicial_senha
from funcoes import funcao_objetivo_pop_senha
from funcoes import selecao_torneio_min
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_senha
import random

## Códigos e discussão



In [2]:
# constantes do problema

#constantes de busca
TAMANHO_POP = 1000
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05
NUM_COMBATENTES_NO_TORNEIO = 3

# constantes do problema
#SENHA = "correcthorsebatterystaple"
SENHA = "abracadabra"
LETRAS_POSSIVEIS = "abcdefghijklmnopqrstuvwxyz"
NUM_GENES = len(SENHA)

In [3]:
# funções locais

def cria_populacao_inicial(tamanho, tamanho_senha):
    return populacao_inicial_senha(tamanho, tamanho_senha, LETRAS_POSSIVEIS)

def funcao_objetivo_pop(populacao):
    return funcao_objetivo_pop_senha(populacao, SENHA)

def funcao_selecao(populacao, fitness):
    return selecao_torneio_min(populacao, fitness, NUM_COMBATENTES_NO_TORNEIO)

def funcao_mutacao(individuo):
    return mutacao_senha(individuo, LETRAS_POSSIVEIS)

In [4]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

melhor_fitness_ja_visto = float("inf") 
contador_geracoes = 0


print("Progresso da melhor senha já vista:")

while melhor_fitness_ja_visto > 0:   # enquanto não atinge o critério de parada
    
    # Seleção - determina o fitness e a população dos melhores individuos
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    # Cruzamento 
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0 #iteração
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO: #se o valor for menor ou igual a chance de cruzamento haverá cruzamento
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        
        contador = contador + 2  
    
    # Mutação
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)
            
    # melhor individuo já visto até agora
    fitness = funcao_objetivo_pop(populacao)
    menor_fitness = min(fitness)
    if menor_fitness < melhor_fitness_ja_visto:        
        posicao = fitness.index(menor_fitness)
        melhor_individuo_ja_visto = populacao[posicao]
        melhor_fitness_ja_visto = menor_fitness
        print("".join(melhor_individuo_ja_visto), "- fitness:", melhor_fitness_ja_visto) 

        contador_geracoes += 1
        
print()
print(f"Após {contador_geracoes} gerações, a senha encontrada foi:")
print("Melhor palpite da senha encontrado:")
print("".join(melhor_individuo_ja_visto))

Progresso da melhor senha já vista:
aarcpccjcrq - fitness: 45
mgpaaceckuc - fitness: 40
aarcpcccdkc - fitness: 32
dbrdbaebhjf - fitness: 28
aarcccdakra - fitness: 14
aarcbaebdra - fitness: 8
aarcbaebbsa - fitness: 7
aarcbadadra - fitness: 6
absabaebcra - fitness: 5
aarabaebbra - fitness: 4
aarabadbbra - fitness: 3
aaracadacra - fitness: 2
aaracadabra - fitness: 1
abracadabra - fitness: 0

Após 14 gerações, a senha encontrada foi:
Melhor palpite da senha encontrado:
abracadabra


------------------

### Discussão

Por mais que esse problema apresentado, de descobrir a senha, seja muito diferente do que foi trabalhado até aqui (caixas binárias e não binárias), esse problema é ótimo para entender como a mesma estrutura de algoritmos genéticos é funcional para muitos problemas diferentes. 

Aqui o critério de parada é quando a senha gerada é a mesma que a senha dada. Ou seja, esse algoritmo genético gera um output determinístico e o algoritmo só para de rodar quando encontra a senha certa. 

E o algoritmo segue a ideia básica dos algoritmos genéticos, cria a população e o melhor fitness já visto, depois a seleção, o cruzamento, a mutação e o hall da fama. 

As funções que foram modificadas para esse problema, quando comparadas com as funções dos problemas anteriores, foram o gene que agora são as letras do alfabeto, a função de seleção, que agora consiste na função de combate, que compara um número n de indivíduos e escolhe aquele com menor fitness para seguir para a próxima geração. Favorecendo os indíviduos que minimizam o problema.

------

## Conclusão



Esse problema consiste em inserir uma senha qualquer em string e utilizar o algoritmo genético para que ele gere senhas até que encontre uma que seja igual aquela inserida no início. Pela estrutura do problema, para analisar se a senha que o computador entrega é a mesma que a senha colocada, vamos analisar a distância: quando a distância entre as letras for 0, a senha é a mesma. Temos assim, o nosso primeiro problema de minimização. 

Por mudar o formato do problema dessa forma, tivemos que alterar algumas funções. Por mais que o esqueleto do problema fosse o mesmo. Nesse caso, nossos genes são as letrinhas e os indivíduos são cada senha gerada, o cruzamento é o mesmo utilizado anterirormente, metade do pai e metade da mão, sendo a mãe os impares e o pai os pares. Já a função de seleção, mudamos para a função combate, já que a seleção por roleta máxima não se adequa ao problema de minimização. Essa função compara indivíduos e seleciona aqueles com menor fitness, ou seja, que tivesse um valor mais próximo da senha original. Com essa função um mesmo indivíduo pode ser selecionado mais de uma vez, o que pode causar o convergimento de forma mais rápida. 

Podemos observar que, esse algoritmo genético gerará uma resposta exata e o que varia é o número de gerações que precisam ser utilizados para encontrar a resposta, ou seja, para que o problema convirja. O número de gerações depende do tamanho da senha inicial, no caso da senha, "correcthorsebatterystaple" houve uma média de 35 gerações, enquanto para a senha "abracadabra" a média foi de 16 gerações.
Dessa forma, esse algoritmo genético foi bem efetivo e convergiu relativamente rápido para o problema de descobrir a senha. 

## Playground

