Descobrindo a senha
===================



## Objetivo



Usar um algoritmo genético para descobrir uma senha.



## Descrição do problema



Neste problema, a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução (veja que isso é algo que não temos no mundo real. Nenhum site irá te dizer se você está acertando ou errando seu palpite). O critério de parada deste problema é quando a senha for descoberta.



## Importações



In [1]:
from funcoes import populacao_inicial_senha
from funcoes import funcao_objetivo_pop_senha
from funcoes import selecao_torneio_min # para problemas de minimização
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_senha
import random

## Códigos e discussão



In [16]:
### CONSTANTES

# relacionadas à busca: mudar se quiser melhorar a eficácia do algoritmo
TAMANHO_POP = 50
NUM_GERACOES = 200
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05
NUM_COMBATENTES_NO_TORNEIO = 2

# relacionadas ao problema a ser resulvido: mudar se quiser alterar o problema que está sendo resolvido
SENHA = input("Adicione a senha que será descoberta:")
LETRAS_POSSIVEIS = "abcdefghijklmnopqrstuvwxyz1234567890ABCDEFGHIJKLMNOPQRSTUVWXYZ@!#$%"
NUM_GENES = len(SENHA)

Adicione a senha que será descoberta: oiDaniiii


In [17]:
# funções locais

def cria_populacao_inicial(tamanho, tamanho_senha):
    return populacao_inicial_senha(tamanho, tamanho_senha, LETRAS_POSSIVEIS)

def funcao_objetivo_pop(populacao): # minimiza a distância entre seu candidato e a senha
    return funcao_objetivo_pop_senha(populacao, SENHA)

def funcao_selecao(populacao, fitness):
    return selecao_torneio_min(populacao, fitness, NUM_COMBATENTES_NO_TORNEIO)

def funcao_mutacao(individuo):
    return mutacao_senha(individuo, LETRAS_POSSIVEIS)

In [18]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

melhor_fitness_ja_visto = float("inf")  # é assim que escrevemos infinito em python

print("Progresso da melhor senha já vista:")

for n in range(NUM_GERACOES):    
    
    # Seleção
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    # Cruzamento
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        
        contador = contador + 2   
        
    # Mutação
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)            
            
    # melhor individuo já visto até agora
    fitness = funcao_objetivo_pop(populacao)
    menor_fitness = min(fitness) # quanto menor o valor do fitness, melhor! Pois é um problema de minimização
    if menor_fitness < melhor_fitness_ja_visto:    # Hall da fama: lista dos melhores indivíduos vistos até agora     
        posicao = fitness.index(menor_fitness)
        melhor_individuo_ja_visto = populacao[posicao]
        melhor_fitness_ja_visto = menor_fitness
        print("".join(melhor_individuo_ja_visto), "- fitness:", melhor_fitness_ja_visto)

print()
print("Melhor palpite da senha encontrado:")
print("".join(melhor_individuo_ja_visto))

Progresso da melhor senha já vista:
jRDUcxDzm - fitness: 124
feRNdczhR - fitness: 103
yy3rpeWgb - fitness: 93
gv3rpeWgb - fitness: 88
feRNdcpgb - fitness: 78
geDUcxpgb - fitness: 66
geDUccpgb - fitness: 57
nmGQwcpgb - fitness: 55
geDUcalhb - fitness: 54
seDUcalhb - fitness: 50
nmDUcalhb - fitness: 47
sjDUcclhb - fitness: 45
nmDUdclhb - fitness: 44
nmDUdclhk - fitness: 39
nmDUdclhh - fitness: 38
nmDVdclhh - fitness: 37
nmDgdclhk - fitness: 33
nmDgddlhh - fitness: 31
nmDgwdlhh - fitness: 30
nmDfwdlhh - fitness: 29
nmDdwdlhh - fitness: 27
nmDdkdlhh - fitness: 21
nmDdndlhh - fitness: 18
oiDagdjhh - fitness: 15
oiDdmdjhh - fitness: 12
oiDaghjhh - fitness: 11
oiDamdjhh - fitness: 9
oiDamgjhh - fitness: 6

Melhor palpite da senha encontrado:
oiDamgjhh


## Conclusão



Podemos concluir, após o desenvolvimento do cóigo, que o uso de algorítimos genéticos são, de fato, o melhor (um, pelo menos, um dos melhores) métodos para a obtenção de uma senha de N caracteres. Afinal, se utilizássemos, por exemplo, uma **busca em grade**, precisaríamos iterar o código um total de n elevado a N vezes, o que seria muito pesado para o computador.

Algo muito interessante a se notar, também, é como esse código é **flexível**, visto que pode aceitar várias modificações em suas funções. Uma das modificações proposta sem sala de aula, por exemplo, é uma mudançã na função de **mutação**, para que haja uma probabilidade de mutar cada letra, e não cada palavra, o que provavelmente aumentaria a eficiência desse algoritmo. 

Além disso, mudando as constantes de busca: percebo que, ao aumentar o número de gerações e o tamanho da população, o tempo de demora para o código rodar aumenta muito (bem mais que os códigos desenvolvidos anteriormente). Entretanto, a probabilidade de acertar a senha com número de gerações e tamanho da população mais altos é maior.

Por fim, vale destacar o papel da constante "NUM_COMBATENTES_NO_TORNEIO" no desempenho do código: um número de combatentes maior resulta em maior homogenização da população. Por isso, percebi, ao ir mudando o valor dessa constante, que valores maiores geram resultados, normalmente, piores.

## Playground

