Descobrindo a senha
===================



## Objetivo



Usar um algoritmo genético para descobrir uma senha.



## Descrição do problema



Neste problema, a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução (veja que isso é algo que não temos no mundo real. Nenhum site irá te dizer se você está acertando ou errando seu palpite). O critério de parada deste problema é quando a senha for descoberta.



## Importações



In [1]:
# Importando 'random' e algumas funções criadas, do arquivo 'funcoes.py', a serem usadas no algoritmo 
# e as renomeando de maneira "auto-explicativa"

from funcoes import populacao_inicial_senha
from funcoes import funcao_objetivo_pop_senha
from funcoes import selecao_torneio_min
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_senha
import random

# Obs: As que foram deixas sem a parte de renomeação é porque terão posição de funções locais neste código.
# Então, serão renomeadas quando elas forem adaptadas para as especificidades deste problema.

## Códigos e discussão



In [2]:
### CONSTANTES

# relacionadas à busca
TAMANHO_POP = 50
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05
NUM_COMBATENTES_NO_TORNEIO = 3

# relacionadas ao problema a ser resolvido
SENHA = "ni8_wei@yu*#19CiNlPuEmM-ec42-60&22-10$04"
LETRAS_POSSIVEIS = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ1234567890_@#*&%!$-"
NUM_GENES = len(SENHA)

In [3]:
# funções locais

def cria_populacao_inicial(tamanho, tamanho_senha):
    return populacao_inicial_senha(tamanho, tamanho_senha, LETRAS_POSSIVEIS)

def funcao_objetivo_pop(populacao):
    return funcao_objetivo_pop_senha(populacao, SENHA)

def funcao_selecao(populacao, fitness):
    return selecao_torneio_min(populacao, fitness, NUM_COMBATENTES_NO_TORNEIO)

def funcao_mutacao(individuo):
    return mutacao_senha(individuo, LETRAS_POSSIVEIS)

In [4]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES) # estabelece uma população inicial aleatória

melhor_fitness_ja_visto = float("inf")  # escrevendo infinito em python

print("Progresso da melhor senha já vista:")

# especificando para o algoritmo rodar até se encontrar um indivíduo com fitness = 0, ou seja, que equivala
# à senha fornecida
while melhor_fitness_ja_visto != 0:   
    
    # Seleção
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    # Cruzamento
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        
        contador = contador + 2   
        
    # Mutação
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)            
            
    # melhor indivíduo já visto até agora
    fitness = funcao_objetivo_pop(populacao)
    menor_fitness = min(fitness) # como esse problema é de minimização, busca-se o menor fitness obtido
    # caso o menor fitness dessa vez seja menor que o melhor encontrado anteriormente
    if menor_fitness < melhor_fitness_ja_visto:  
        # pega-se o index dele dentro de fitness
        posicao = fitness.index(menor_fitness)
        # altera-se o melhor indivíduo encontrado para o desse respectivo fitness
        melhor_individuo_ja_visto = populacao[posicao]
        # redefine-se o melhor fitness já visto
        melhor_fitness_ja_visto = menor_fitness
        print("".join(melhor_individuo_ja_visto), "- fitness:", melhor_fitness_ja_visto)

print()
print("Melhor palpite da senha encontrado:")
print("".join(melhor_individuo_ja_visto))

Progresso da melhor senha já vista:
G6TiFZn8Zy#I6gOkIfs6ZX0nMa&bd%i$7cn2I318 - fitness: 975
Tc333VwPDUF$*K0wGxq4Ar!WZs57254CFVxeETND - fitness: 948
oxTiyNEdXxc%-c_lo#Qj_r!WZs57254CY@b4KL5b - fitness: 857
Tc3iyNEdXxc%-c_loUQj_r!WZs57254CY@b4KL5b - fitness: 800
Tc3iyNEdXxc%-c_loUQj_r!WZs57254CY@n2I318 - fitness: 737
Tc3iyVwPDUF$*K0wGUQj_r!WZs57254CY@b4KL5b - fitness: 724
Tc3iyNEdXxc%-c_loUQj_rW*Zs57254CY@n2I318 - fitness: 664
Tc3iyNEdXxF$*K0loUQj_rW*Zs57254CY@n2I318 - fitness: 604
Tc3iyVEdXxF$*K0loUQj_rW*Zs57254CY@n2I318 - fitness: 596
Tc3iyVwPDxF$*K0loUQj_rW*Zs57254CY@n2I318 - fitness: 574
Tc3byVwPDxF$*K0loUQj_rW*Zs57254CY@n2I318 - fitness: 567
Tc3iyVwPqxF$*K0loUQj_rW*Zs57254CY@n2I318 - fitness: 529
Tc3iyVwPqxF$*K0loUQj_rW*Zs57254CY@J2I318 - fitness: 493
Tc3iyVwPqxF$*K0loUQjQrW*Zs57254CY@J2I318 - fitness: 479
Tc3iyVwPrxF$*K0loUQjQrW*Zs57254CY@J2I318 - fitness: 478
Tc3iyVwPqxF$*K0loUQjQrW*Zs57254CQ@J2I318 - fitness: 471
Tc3iyVwPrxF$*K0loUQjQrW*Zs57254CQ@J2I318 - fitness: 470
Tc3iyVwPrxF$

## Conclusão

<p style='text-align: justify'> Com este algoritmo, foi possível resolvermos o problema de descobrir a senha. Nele: utilizamos o operador de seleção por torneio; mantivemos o operador de cruzamento simples; e, diferentemente dos experimentos anteriores, os genes que compõem os indivíduos que, por sua vez, formam a população, são criados aleatoriamente a partir de uma lista de caracteres fornecida. Ademais, a função objetivo desta vez conta com a função ord(), que transforma cada caractere em um número ordinal respectivo, para ser possível calcular a distância de cada gene de um indivíduo em relação a senha original. Assim, quanto menor a distância, mais próximo está de acertar, logo, a função fitness é menor. Outro fato inserido é o hall da fama que, no caso, seria o melhor indivíduo já visto, que, pelo nome, já é autoexplicativa sua função de selecionar o melhor indivíduo de acordo com os critérios de minimização de fitness.

Cabe ressaltar que, neste experimento, o problema é de minimização e não mais maximização, como era até anteriormente. Além disso, esse experiemnto se caracteriza como <b>probabilístico</b>, já que, apesar de ter sido rodado diversas vezes e a resposta ser a mesma e a correta (por enquanto), todos os artefatos utilizados para construção dele (como: criação de gene, indivíduo, cruzamento, mutação, seleção) são probabilísticos, logo, ele é um algoritmo probabilístico também. Além de que, variando-se o número de gerações, a resposta poderia não ser a mesma. Sem contar que, apesar da probabilidade ser muito pequena e de termos usado o 'while' para fazer com que ele rode até ser exatamente a mesma senha, pode haver uma situação em que o algoritmo rode, rode e rode (infinitamente) e nunca se chegue no resultado esperado, assim, pode ser que o que é preciso para a formação da senha, por exemplo, não seja escolhido pelas funções.

Variações que piorariam o algoritmo seriam: se, para os combatentes (na seleção por torneio mínimo), <i>n</i> (tamanho da população) fossem escolhidos, já que englobaria todos da população, sendo apenas o melhor indivíduo dela escolhido, e, por conseguinte, diminuindo a variabilidade genética; ou se 1 fosse escolhido, pois funcionaria como uma ferramenta de busca aleatória. Com isso, o ideal varia entre 3 e 5 escolhidos para o combate.

Uma aplicabilidade para tal código, já que esse cenário da senha não é nada realístico, seria a comparação e tentativa de encontrar uma sequência de DNA, por exemplo, que se assemelha a outra já conhecida. Com isso, é possível ver o quão distante está da sequência, quais são os genes distantes, avaliar diferentes sequências e analisar quais mais se aproximam de uma dada, e, assim, poder ver compatibilidade de semelhança de um objeto de análise com certas espécies de sequências já cadastradas.</p>

## Playground

