Descobrindo a senha
===================



## Objetivo



Usar um algoritmo genético para descobrir uma senha.



## Descrição do problema



Neste problema, a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução (veja que isso é algo que não temos no mundo real. Nenhum site irá te dizer se você está acertando ou errando seu palpite). O critério de parada deste problema é quando a senha for descoberta.



## Importações



In [19]:
# Importando 'random' e algumas funções criadas, do arquivo 'funcoes.py', a serem usadas no algoritmo 
# e as renomeando de maneira "auto-explicativa"

from funcoes import populacao_inicial_senha
from funcoes import funcao_objetivo_pop_senha
from funcoes import selecao_torneio_min
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_senha
import random

# Obs: As que foram deixas sem a parte de renomeação é porque terão posição de funções locais neste código. Então,
# serão renomeadas quando elas forem adaptadas para as especificidades deste problema.

## Códigos e discussão



In [20]:
### CONSTANTES

# relacionadas à busca
TAMANHO_POP = 50
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05
NUM_COMBATENTES_NO_TORNEIO = 3

# relacionadas ao problema a ser resulvido
SENHA = "ni8_wei@yu*#19CiNlPuEmM-ec42-60&22-10$04"
LETRAS_POSSIVEIS = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ1234567890_@#*&%!$-"
NUM_GENES = len(SENHA)

In [21]:
# funções locais

def cria_populacao_inicial(tamanho, tamanho_senha):
    return populacao_inicial_senha(tamanho, tamanho_senha, LETRAS_POSSIVEIS)

def funcao_objetivo_pop(populacao):
    return funcao_objetivo_pop_senha(populacao, SENHA)

def funcao_selecao(populacao, fitness):
    return selecao_torneio_min(populacao, fitness, NUM_COMBATENTES_NO_TORNEIO)

def funcao_mutacao(individuo):
    return mutacao_senha(individuo, LETRAS_POSSIVEIS)

In [23]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

melhor_fitness_ja_visto = float("inf")  # escrevendo infinito em python

print("Progresso da melhor senha já vista:")

# especificando para o algoritmo rodar até se encontrar um indivíduo com fitness = 0
while melhor_fitness_ja_visto != 0:   
    
    # Seleção
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    # Cruzamento
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        
        contador = contador + 2   
        
    # Mutação
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)            
            
    # melhor individuo já visto até agora
    fitness = funcao_objetivo_pop(populacao)
    menor_fitness = min(fitness)
    if menor_fitness < melhor_fitness_ja_visto:        
        posicao = fitness.index(menor_fitness)
        melhor_individuo_ja_visto = populacao[posicao]
        melhor_fitness_ja_visto = menor_fitness
        print("".join(melhor_individuo_ja_visto), "- fitness:", melhor_fitness_ja_visto)

print()
print("Melhor palpite da senha encontrado:")
print("".join(melhor_individuo_ja_visto))

Progresso da melhor senha já vista:
_sQhzKyC5c8TBNRD6cNhHrhSlh%O*0BldKeR2z1j - fitness: 927
OB6wDKo#e_WK-%FcPZesdjYlgq-bJYQkcJ25W907 - fitness: 902
OB6wDKo#e_WK-%FcPZesdjYlp93&FPN#5bMFZ&-@ - fitness: 833
_sQhzKyC5c8TBNRD6cNhHrhSlh%O*0QkcJ25W907 - fitness: 779
_sQhzKyC5c8TBNRD6cNhHrhSlh%O*0Qk5bMF$&-@ - fitness: 767
_sQhzKyC5c8TBNAlcqQl5mGCMbubN&D*Ob25W907 - fitness: 739
_sQhzKy#e_WK-%FRAGQl5mG4eU2O*0QkcJ25W907 - fitness: 700
_sQhzKyC5c8K-%FRAGQl5mG4eU2O*0QkcJ25W907 - fitness: 687
_sQhzKy#e_WK-%FRAGQl5mG4eU2O*0Q*Ob25W907 - fitness: 639
_sQhzKyC5c8K-%FRAGQl5mG4eU2O*0Q*Ob25W907 - fitness: 626
_sQhzKy#e_WK-%FRAkQl5mG4eU2O*0D*Ob25W907 - fitness: 590
_sQhzKy*e_WK-%FRAkQlYmG4eU2O*0D*Ob25W907 - fitness: 587
_sQhzKy*e_WK-%FRAkQlYmG4eU2O*0D*cJ25W907 - fitness: 583
_sQhzKyCe_WK-%FRAkQlYmG4eU2O*0D*Ob25W907 - fitness: 568
_sQhzKyCe_WK-%FRAkQl5mG4eU2O*0Q*2b25W907 - fitness: 548
_sQhzKyCe_WK-%FRAkQlYmG4eU2O*01*cJ25W907 - fitness: 545
_sQhzKyCe_WK-%FRAkQl5mG4eU2O*0D*2b25W907 - fitness: 535
_sQhzKyCe_WK

## Conclusão

Com este algoritmo, foi possível resolvermos o problema de descobrir a senha. Nele, utilizamos o operador de seleção por torneio, mantivemos o operador de cruzamento simples, e, diferentemente dos experimentos anteriores, os genes que compõem os indivíduos que, por sua vez, formam a população, são criados aleatoriamente a partir de uma lista de caracteres fornecida. Ademais, a função objetivo desta vez conta com a função ord(), que transforma cada caractere em um número ordinal respectivo, para ser possível calcular a distância de cada gene de um indivíduo em relação a senha original. Assim, quanto menor a distância, mais próximo está de acertar, logo, a função fitness é menor. Outro fato inserido é o hall da fama que, no caso, seria o melhor indivíduo já visto, que, pelo nome, já é autoexplicativa sua função de selecionar o melhor individuo de acordo com os critérios de minimização de fitness.

Cabe ressaltar que, neste experimento, o problema é de minimização e não mais maximização, como era até anteriormente. Além disso, é interessante dizer que tal experimento se caracteriza como probabilístico, haja visto que, a cada vez que é rodado, resulta em tentativas diferentes.

Variações que piorariam o algoritmo seriam: se, para os combatentes (na seleção por torneio mínimo), n (tamanho da população) fossem escolhidos, já que englobaria todos da população, sendo apenas o melhor indivíduo dela escolhido, e, por conseguinte, diminuindo a variabilidade genética; ou se 1 fosse escolhido, pois funcionaria como uma ferramenta de busca aleatória. Com isso, o ideal varia entre 3 e 5 escolhidos para o combate.

Uma aplicabilidade para tal código, já que esse cenário da senha não é nada realístico, seria a comparação e tentativa de encontrar uma sequência de DNA, por exemplo, que se assemelha a outra já conhecida. Com isso, é possível ver o quão distante está da sequência, quais são os genes distantes, avaliar diferentes sequências e analisar quais mais se aproximam de uma dada.

## Playground

