A senha de tamanho variável
========================================



## Introdução



No experimento A.05 realizamos a descoberta de senhas, porém, lá definimos qual seria o tamanho dessa senha através do "NUMERO_GENES = len(SENHA)", que nos indicava que o tamanho dos genes (caractéres da senha) seriam iguais a quantidade de letras que a senha teria.
Aqui, o tamanho da senha é um mistério, e o algoritmo tem que tentar decifrar por si. 
Podemos utilizar alguams estratégias mas seguiremos com uma penalidade para que, cada vez que ele erra, da próxima vez não cometer o mesmo erro.

## Objetivo



Usar um algoritmo genético para descobrir uma senha de tamanho variável.




## Importações



Todos os comandos de `import` devem estar dentro desta seção.



In [6]:
from funcoes import populacao_inical_senhavariavel as populacao_inicial
from funcoes import funcao_objetivo_senhavariavel as funcao_objetivo
from funcoes import selecao_senhavariavel
from funcoes import cruzamento_simples_senhavariavel as funcao_cruzamento
from funcoes import mutacao_senhavariavel
import random

#Parte das importações das funções do arquivo funções.py.

## Códigos e discussão



In [7]:
#CONSTANTES

#Constantes relacionadas à busca:

TAMANHO_POPULACAO = 10
TAMANHO_TORNEIO = 3
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05

#Constantes relacionadas ao problema que será resolvido:

SENHA_REAL = 'Kim Petras' #Senha de "entrada".
LETRAS = 'abcdefghijqlmnopqrstuvwxyzABCDEFGHIJQLKMNOPQRSTUVWXYZ ' #Possibilidades a serem testadas, uma lista de elementos que contenha os caracteres usados na senha, incluindo espaço.
TAMANHO_SENHA_MAX = 100 #Ponto de partida do algoritmo, o valor máximo que ele pode assumir de elementos para ir tentando acertar o tamanho da senha.
PENALIDADE = 100 #O quanto o algoritmo será punido quando cometer um erro (colocar caractere errado, em excesso, etc.).

In [8]:
#Funções que serão utilizadas somente nesse experimento:

def cria_populacao_inicial(tamanho_populacao, tamanho_senha_max):
    return populacao_inicial(tamanho_populacao, tamanho_senha_max, LETRAS)

def funcao_objetivo_pop(populacao):
    return funcao_objetivo(populacao, SENHA_REAL, PENALIDADE)

def funcao_selecao(populacao, fitness):
    return selecao_senhavariavel(populacao, fitness, TAMANHO_TORNEIO)

def funcao_mutacao(individuo):
    return mutacao_senhavariavel(individuo, LETRAS, TAMANHO_SENHA_MAX)

In [9]:
#Parte da implementação da busca por algoritmos genéticos, usando o mesmo mecanismo (com alterações leves) do problema A.05:
populacao = cria_populacao_inicial(TAMANHO_POPULACAO, TAMANHO_SENHA_MAX) #Note que aqui, ao invés do número de genes, que seriam o número de caracteres exatos, colocamos o tamanho máximo que a senha pode assumir.

melhor_fitness_ja_visto = float("inf")  

print("Progresso da melhor senha já vista:") #Essa parte serve para anlisarmos quantas vezes o algoritmo tentou realizar a busca até acertar.
num_gen = 1

while melhor_fitness_ja_visto != 0: #Enquanto o fitness for diferente de zero, executaremos as etapas a seguir: 
    #Parte da seleção:
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    #Parte do cruzamento:
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        
        contador = contador + 2   
        
    #Parte da mutação:
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)            
            
    #Escolha do melhor individuo já visto até agora:
    fitness = funcao_objetivo_pop(populacao)
    menor_fitness = min(fitness)
    if menor_fitness < melhor_fitness_ja_visto:        
        posicao = fitness.index(menor_fitness)
        melhor_individuo_ja_visto = populacao[posicao]
        melhor_fitness_ja_visto = menor_fitness
        string_individuo = ''.join(melhor_individuo_ja_visto)
        print(f'Geração: {num_gen:10} - Indivíduo: {string_individuo:80} - fitness: {melhor_fitness_ja_visto}') #Print com o número das gerações necessárias para adivinhar a senha, qual a senha (indivíduo) e a contagem dos fitness. Note que quando o fitness chega a 0 é quando acahmos nossa senha ideal, como definido no começo do nosso loop.
    num_gen += 1
    
print()
print("Melhor palpite da senha encontrado:")
print("".join(melhor_individuo_ja_visto))

Progresso da melhor senha já vista:
Geração:          1 - Indivíduo: hbLvHeSJUdfCd VL                                                                 - fitness: 863
Geração:          3 - Indivíduo: ZpUuHeSJUdfCd VL                                                                 - fitness: 839
Geração:         21 - Indivíduo: VpUuHeSJUdfCd VL                                                                 - fitness: 835
Geração:         22 - Indivíduo: VpUnHeSJUdfCd VL                                                                 - fitness: 828
Geração:         28 - Indivíduo: VpUnHeSJUifCd VL                                                                 - fitness: 823
Geração:         36 - Indivíduo: VpUnHevJUifCd VL                                                                 - fitness: 792
Geração:         41 - Indivíduo: VpUnHevpUifCd VL                                                                 - fitness: 754
Geração:         42 - Indivíduo: VpUnHevpUifCd               

## Conclusão



Utilizei a penalidade para ele "aprender" que colocou uma letra num lugar que não deveria estar. Com uma penalidade maior ou uma senha menor com espaçamento fica muito visivel ver esse trabalho que ele tem de corrigir onde era para ser um espaço.
Basicamente, é a mesma coisa que concluimos no experimento A.05: Como se fosse um hacker girando várias letrinhas, porém, aqui, quando tem um espaço você tem uma letra "em branco" que pode ser considerada o espaço.
Outro ponto interessante é notar a correção das letras minúsculas pelas maiúsculas, que deve ser no mesmo mecanismo de girar as opções (letras).

É um método meio exaustivo, de certo modo, uma vez que se você tem uma lista com 10 letras, e uma senha com 5, você tem que testar para os 5 espaços as 10 letras até ser a "correta". Dependendo o tamanho da senha demora muito mais tempo, e também da complexidade do símbolo. Essa é basicamente a lição de segurança cibernética para a criação de senhas justificada com nossos experimentos de Algoritmos Genéticos.


## Referências consultadas



1.  Delete este texto e inclua suas referências ordenadas numericamente. Se for referenciar no notebook, use o número entre colchetes (exemplo: para citar essa referência aqui escreva &ldquo;[1]&rdquo; sem as áspas).

2.  Cada item deve ser numerado. Siga o padrão apresentado.

3.  Caso não tenha nenhuma referência consultada, delete esta seção e o texto contido nela!



## Playground



Todo código de teste que não faz parte do seu experimento deve vir aqui. Este código não será considerado na avaliação.

