A senha de tamanho variável
========================================



## Introdução



<p style='text-align: justify'> Tendo resolvido o problema de descobrir a senha no <a href="https://github.com/viyuetuki/aula_redes/blob/main/AlgoritmosGeneticos/experimento%20A.05%20-%20descobrindo%20a%20senha.ipynb">experimento A.05</a>, enfrentar o desafio de descobri-la, mas sem fornecer seu tamanho quando for gerada, parece muito interessante e relevante de se tentar! E é exatamente esse o experimento escolhido para se resolver aqui.

A partir do uso dos conceitos de genes, indivíduo, população, função objetivo, cruzamento, mutação e seleção, além da adoção de penalidade, é que nossa metodologia a ser adotada vai ser desenvolvida a seguir.</p>

## Objetivo



Resolver o problema da senha sem fornecer a informação do tamanho da senha para a função que gera a população.



## Importações



<p style='text-align: justify'>
<ul>
    <li> Importando 'random' e algumas funções criadas, do arquivo 'funcoes.py', a serem usadas no algoritmo e as renomeando de maneira "auto-explicativa":</li>
</ul></p>

In [1]:
from funcoes import populacao_inicial_senha_var
from funcoes import funcao_objetivo_pop_senha_var
from funcoes import selecao_torneio_min
from funcoes import cruzamento_ponto_simples_senha_var as funcao_cruzamento
from funcoes import mutacao_senha
from funcoes import mutacao_tam_senha_var
import random

<p style='text-align: justify'>
<i>Obs: As que foram deixas sem a parte de renomeação é porque terão posição de funções locais neste código.
Então, serão renomeadas quando elas forem adaptadas para as especificidades deste problema.
</i></p>

## Códigos e discussão



<p style='text-align: justify'>
<ul>
    <li>Definindo as constantes, sendo elas: relacionadas à busca, que, se mudadas, alteram a eficácia do algoritmo; e relacionadas ao problema a ser resolvido, que, caso alteradas, mudam o problema em questão que se está resolvendo:</li>
</ul></p>

In [2]:
### CONSTANTES

# relacionadas à busca
TAMANHO_POP = 50
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05
NUM_COMBATENTES_NO_TORNEIO = 3

# relacionadas ao problema a ser resolvido
SENHA = "ni8_wei@yu*#19CiNlPuEmM-ec42-60&22-10$04"
LETRAS_POSSIVEIS = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ1234567890_@#*&%!$-"
TAMANHOS_SENHA = list(range(4, 80))
PENALIDADE = 20

<p style='text-align: justify'>
<ul>
    <li> Definindo as funções locais, as quais utilizam de alguns valores padrões definidos neste notebook:</li>
</ul></p>

In [3]:
# funções locais

def cria_populacao_inicial(tamanho_pop, tamanhos_senha):
    return populacao_inicial_senha_var(tamanho_pop, tamanhos_senha, LETRAS_POSSIVEIS)

def funcao_objetivo_pop(populacao):
    return funcao_objetivo_pop_senha_var(populacao, SENHA, PENALIDADE)

def funcao_selecao(populacao, fitness):
    return selecao_torneio_min(populacao, fitness, NUM_COMBATENTES_NO_TORNEIO)

def funcao_mutacao_senha(individuo):
    return mutacao_senha(individuo, LETRAS_POSSIVEIS)

def funcao_mutacao_tamanho_senha(individuo):
    return mutacao_tam_senha_var(individuo, TAMANHOS_SENHA, LETRAS_POSSIVEIS)

<p style='text-align: justify'>
<ul>
    <li> Código contendo a lógica para a resolução do problema:</li>
</ul></p>

In [4]:
populacao = cria_populacao_inicial(TAMANHO_POP, TAMANHOS_SENHA) # estabelece uma população inicial aleatória

melhor_fitness_ja_visto = float("inf")  # escrevendo infinito em python

print("Progresso da melhor senha já vista:")

contador_geracao = 0

# especificando para o algoritmo rodar até se encontrar um indivíduo com fitness = 0, ou seja, que equivala
# à senha fornecida
while melhor_fitness_ja_visto != 0:   
    
    # Seleção
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    # Cruzamento
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        
        contador = contador + 2   
        
    # Mutação
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            operadores_mutacao = [1,2]
            operador_mut = random.choice(operadores_mutacao)
            if operador_mut == 1:
                individuo = populacao[n]
                populacao[n] = funcao_mutacao_senha(individuo)
            else:
                individuo = populacao[n]
                populacao[n] = funcao_mutacao_tamanho_senha(individuo)
            
    # melhor indivíduo já visto até agora
    fitness = funcao_objetivo_pop(populacao)
    menor_fitness = min(fitness) # como esse problema é de minimização, busca-se o menor fitness obtido
    # caso o menor fitness dessa vez seja menor que o melhor encontrado anteriormente
    if menor_fitness < melhor_fitness_ja_visto:  
        # pega-se o index dele dentro de fitness
        posicao = fitness.index(menor_fitness)
        # altera-se o melhor indivíduo encontrado para o desse respectivo fitness
        melhor_individuo_ja_visto = populacao[posicao]
        # redefine-se o melhor fitness já visto
        melhor_fitness_ja_visto = menor_fitness
        print("".join(melhor_individuo_ja_visto), "- fitness:", melhor_fitness_ja_visto)
    
    contador_geracao = contador_geracao + 1

print()
print("Senha verdadeira:")
print(SENHA, " : tamanho = ", len(SENHA))
print("Melhor palpite da senha encontrado:")
print("".join(melhor_individuo_ja_visto), " : tamanho = ", len("".join(melhor_individuo_ja_visto)))
print("Resultado obtido após ", contador_geracao, " gerações.")

Progresso da melhor senha já vista:
Yn0Egd - fitness: 757
hj4IwgG - fitness: 729
hj4IwgnH - fitness: 688
hj4_pgnH - fitness: 673
hj4_wgnH - fitness: 666
hj4_wgnHw0*09RT - fitness: 660
kj4_wgnHw0*09RT - fitness: 657
kj4_wgnAw0*09RT - fitness: 650
kj4_wgnAw0*09 - fitness: 648
kj4_wgnAwB*09RT - fitness: 632
kj4_wgnAwB*09 - fitness: 630
kj4_wgnAwt*09 - fitness: 580
kj4_wgnAwt*#9 - fitness: 567
kj4_wgnAwt*#93Pw - fitness: 540
kj4_wgnAwt*#93Pw9j - fitness: 523
kj4_wgnAwt*#93PwBj - fitness: 514
kj4_wgnAwt*#93PwVj - fitness: 510
nj4_wgnAwt*#93PwVj - fitness: 507
nj4_wgnAwt*#93HwVj - fitness: 499
nj4_wgnAwt*#93P_VjiZC - fitness: 497
nj4_wgnAwt*#63P_VjiZC - fitness: 494
nj4_wgnAyt*#63P_VjiZC - fitness: 492
nj4_wgnAyt*#63P_VjiZCBW3 - fitness: 491
nj4_wgnAyt*#63P_VjiqCBW3 - fitness: 468
nj4_wgnAyt*#63PhVjiZCsW3 - fitness: 445
nj4_wgnAyt*#63PhVjiZCsU3 - fitness: 443
nj4_wgnAyt*#63PhVjiZCsT3 - fitness: 442
nj4_wgnAyt*#63PhVjDZCsT3 - fitness: 429
nj4_wgnAyt*#63PhMjDZCsT3 - fitness: 422
nj4_wgnAyt*#63

## Conclusão



<p style='text-align: justify'> A partir desse algoritmo desenvolvido, foi possível resolvermos o problema de descobrir a senha sem ser informado o tamanho dela. Para vencermos esse desafio proposto, foi necessário implementar novas funções desde geração de um indivíduo, população, cruzamento, mutação e função objetivo Isso porque: foi cobrado que não se informasse o tamanho da senha para a geração dos indivíduos da população; foi preciso que, no cruzamento, a escolha do ponto de corte ocorresse de acordo com o progenitor de menor tamanho; era necessário que se houvesse dois operadores de mutação, um para mutas letras e outro para alterar o tamanho da senha, adequando-a pra esse novo comprimento; além de que a função objetivo, além de medir distância das letras com a função ord(), que as transformam em números respectivos, deveria penalizar aqueles indivíduos que não possuíam tamanho correto de acordo com o quão distantes estavam.</p>

<p style='text-align: justify'> Ele se configura, como alguns anteriores, como um problema de minimização. E esse algortimo é dito <b>probabilístico</b>, haja visto que, apesar de ter sido rodado diversas vezes e a resposta ser a mesma e a correta (por enquanto), todos os artefatos utilizados para construção dele (como: criação de gene, indivíduo, cruzamento, mutação, seleção) são probabilísticos, logo, ele é um algoritmo probabilístico também. Além de que, variando-se o número de gerações, a resposta poderia não ser a mesma (vimos, inclusive, que, a cada tentativa nesse código, obtínhamos tentativas de senhas diferentes). Sem contar que, apesar da probabilidade ser muito pequena e de termos usado o 'while' para fazer com que ele rode até ser exatamente a mesma senha, pode haver uma situação em que o algoritmo rode, rode e rode (infinitamente) e nunca se chegue no resultado esperado, assim, pode ser que o que é preciso para a formação da senha, por exemplo, não seja escolhido pelas funções. </p>
    
<p style='text-align: justify'> Análises sobre como a variação de parâmetros influencia na convergência para o resultado é interessante de se fazer como futuros passos. Por exemplo, analisar como o peso atribuido à penalidade influencia na velocidade a se chegar na senha correta.</p>
    
<p style='text-align: justify'>E, como já dito no experimento 5, esses problemas de senha podem ser pensados para se resolver problemas de sequências biológicas.</p>

## Playground

