Descobrindo a senha
===================



## Introdução

## Objetivo



Resolver o problema da senha sem fornecer a informação do tamanho da senha para a função que gera a população.


## Descrição do problema



Neste problema, a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução (veja que isso é algo que não temos no mundo real. Nenhum site irá te dizer se você está acertando ou errando seu palpite). O critério de parada deste problema é quando a senha e seu respectivo tamanho for descoberta.


## Importações



Gerei um arquivo de funções (**funcoes_GA_01.py**) com as todas as funções necessárias e adequadas para esse experimento. Tentei importar o arquivo inteiro, mas as funções não estavam sendo reconhecidas. Por isso peço licença poética para utilizar o *import all*, considerando que o arquivo inteiro será utilizado para este notebook.

In [1]:
from funcoes_GA_01 import *

## Códigos e discussão



Ao contrário do experimento-irmão deste, em que também tínhamos que descobrir a senha com tamanho definido (A.05), desta vez não se pode definir uma variável com o tamanho da senha (**NUM_GENES**, cujo valor era **len(SENHA)**). Em seu lugar, atribuí um limite de tamanho a ser explorado pelo algoritmo (**TAMANHO_MAX**).

Também foi necessário definir uma constante de penalidade para ser utilizada na função objetivo da população (**funcao_objetivo_pop_sv**) para punir candidatos que assumam tamanhos absolutos distantes do tamanho da senha verdadeira (vide implementação em **funcoes_GA_01**).

In [15]:
# constantes gerais
TAMANHO_POP = 50
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05
NUM_COMBATENTES_NO_TORNEIO = 3

# constantes específicas
SENHA = "41 M3U D3U5 C0M0 3 B0M S3R V1D4 L0K4"
LETRAS = "abcdefghijkqlmnopqrstuvwxyzABCDEFGHIJKQLMNOPQRSTUVWXYZ0123456789 !@#$%"
TAMANHO_MAX = 100
PENALIDADE = 50

A geração, seleção, cruzamento e mutação da população são os mesmos da implementação do experimento **A.05**, pois a estrutura do algoritmo genético se mantém. O principal fator de adequação entre os problemas é como as respectivas funções para cada tarefa estão especificamente definidas.

In [19]:
# geração da população

populacao = populacao_inicial_sv(TAMANHO_POP, LETRAS)

melhor_fitness_ja_visto = float("inf")  # é assim que escrevemos infinito em python

print("Progresso da melhor senha já vista:")

while melhor_fitness_ja_visto != 0:   
    
    # Seleção
    fitness = funcao_objetivo_pop_sv(populacao, SENHA, PENALIDADE)
    populacao = selecao_torneio_senha_sv(populacao, fitness, NUM_COMBATENTES_NO_TORNEIO)
    
    # Cruzamento
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = cruzamento_ponto_simples_sv(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        
        contador = contador + 2   
        
    # Mutação
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = mutacao_sv(individuo, LETRAS, TAMANHO_MAX)            
            
    # melhor individuo já visto até agora
    fitness = funcao_objetivo_pop_sv(populacao, SENHA, PENALIDADE)
    menor_fitness = min(fitness)
    if menor_fitness < melhor_fitness_ja_visto:        
        posicao = fitness.index(menor_fitness)
        melhor_individuo_ja_visto = populacao[posicao].copy()
        melhor_fitness_ja_visto = menor_fitness
        print("".join(melhor_individuo_ja_visto), "- fitness:", melhor_fitness_ja_visto)


Progresso da melhor senha já vista:
lSGboEXsPcQcGCWL98aPs$s9kRo2D@i% - fitness: 1306
DQ2nucSB7C!!E@c gPTWamLm$ - fitness: 1220
DQ2nucSB7C!!E@cTpr51#ipfBgP9%6i% - fitness: 1069
DQ2nucSB7C!!E@cRCG$HL0StKJZlD@i% - fitness: 948
@H1 ucSB7C!!E@cRCG$HL0StKJo2D@i%VQ! - fitness: 916
!1GbocSB7C!!E@cRCG$HL0StKJo2D@i%VQ! - fitness: 892
DQ2nucSB7C!!E@JH4G$HL1StKJo2D@i%VQ! - fitness: 873
@H1 IrSB7C!!E@JHCG$HL0StKJo2D@i%VQ! - fitness: 858
@H1 IcSB7C!!E@JH4G$HL1StKJo2D@i%VQ! - fitness: 827
@H1 IrSB7C!!E@JH4G$HL1StKJo2D@S%VQ! - fitness: 820
@H1 IcSB7C!!E@JH4G$HL1StKJo2D@S%VQ! - fitness: 805
@H1 IcSB7C!!E@JH4G$HL1StKJd2D@S%VQ! - fitness: 794
@H1 IcSB7C!!E@JH4G$HL1StKJdZD@S%VQ! - fitness: 762
@F1 IcSB7C!!E@JH4G$HL1StKJdZD@S%VQ! - fitness: 760
@H1 IcSB7C!!E@JH4G$HLMStKJdZD@S%VQ! - fitness: 734
8H1 IcSB7C!!E@JH4G$HLMStKJdZD@S%VQ! - fitness: 726
@H1 IcSB7C!!E@JH4G$HLMSdKJdZD@S%VQ! - fitness: 718
8H1 IcSB7C!!E@JH4G$HLMSdKJdZD@S%VQ! - fitness: 710
8H1OIcSB7C!!E@JH4G$HLMStKJdZD@S%Vk! - fitness: 709
8H1OIcSB7C!

In [20]:
print()
print("Melhor palpite da senha encontrado:")
print("".join(melhor_individuo_ja_visto))


Melhor palpite da senha encontrado:
41 M3U D3U5 C0M0 3 B0M S3R V1D4 L0K4


## Conclusão

A resolução deste problema foi interessante. Realizei as duas mutações necessárias - a de letra e de tamanho - em uma função de mutação unificada, que aleatoriamente realiza a mutação no gene ou no tamanho em cada candidato.

A estratégia utilizada foi mutar as letras ou símbolos por meio do método randint, cujo escopo de genes é o tamanho do indivíduo. A mutação do tamanho gera aleatoriamente um novo tamanho considerando o limite definido, com dois métodos de correção: corte ou adição. Assim, em várias vezes que rodei o progresso da senha, pude observar o tamanho crescer e diminuir conforme o afunilamento do fitness. Acho pertinente notar que o tamanho se estabilizou primeiro em todas as vezes que rodei, pois isso que permite a convergência dos dígitos corretos. Por sua vez, o tamanho teve a tendência de se estabilizar por volta da metade do processo.

Em comparação com o experimento A.05, se mantém o fato de que o progresso nunca segue o mesmo caminho, obviamente. Também é quase regra que os finalistas se mantém sequenciais para as constantes definidas aqui (chance de mutação, número de combatentes no sorteio, etc.). Portanto, avalio que esse algoritmo como um primo próximo do referido A.05, cuja performance/eficiência é a mesma, mas com um pouquinho mais de esforço pessoal rolando no _backstage_, cujo único vislumbre dos expectadores quanto a isso é a feiura das tentativas iniciais.

## Playground

