Descobrindo a senha
===================



## Objetivo



Usar um algoritmo genético para descobrir uma senha.



## Descrição do problema



Neste problema, a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução (veja que isso é algo que não temos no mundo real. Nenhum site irá te dizer se você está acertando ou errando seu palpite). O critério de parada deste problema é quando a senha for descoberta.



## Importações



In [1]:
from funcoes import populacao_inicial_senha
from funcoes import funcao_objetivo_pop_senha
from funcoes import selecao_torneio_min
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_senha
import random

## Códigos e discussão



##### PSEUDOCÓDIGO:

- Criar uma lista com a senha alfabética
- Converter as letras para unicode, conforme tabela tabela ASCII, utilizando a função ord
- Criar várias listas de variáveis numéricas de mesmo tamanho da senha
- Comparar essas listas com a lista criada, verificando a melhor aproximação com cada elemento
- Subtrair cada elemento das listas possíveis com a lista criada, obtendo o resultado absoluto
- Eleger as possíveis listas com as melhores aproximações, ou seja, menor fitness (problema de minimização)

In [2]:
# Constantes

# Relacionadas à busca
TAMANHO_POP = 100
NUM_GERACOES = 50
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05
NUM_COMBATENTES_TORNEIO = 3

# Relacionadas ao problema a ser resolvido
SENHA = '!%$#@&*'
CARACTERES_POSSIVEIS = '!%$#@&*abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'
NUM_GENES = len(SENHA)

In [3]:
# funções locais

def cria_populacao_inicial(tamanho, tamanho_senha):
    return populacao_inicial_senha(tamanho, tamanho_senha, CARACTERES_POSSIVEIS)

def funcao_objetivo_pop(populacao):
    return funcao_objetivo_pop_senha(populacao, SENHA)

def funcao_selecao(populacao, fitness):
    return selecao_torneio_min(populacao, fitness, NUM_COMBATENTES_TORNEIO)

def funcao_mutacao(individuo):
    return mutacao_senha(individuo, CARACTERES_POSSIVEIS)

In [4]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

melhor_fitness_ja_visto = float('inf')

print('Progresso de geração de senhas convergindo para a melhor senha:')

while melhor_fitness_ja_visto != 0:
    
    # Seleção
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    # Cruzamento
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador+1] = filho2
            
        contador = contador + 2
        
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)
            
    fitness = funcao_objetivo_pop(populacao)
    menor_fitness = min(fitness)
    if menor_fitness < melhor_fitness_ja_visto:
        posicao = fitness.index(menor_fitness)
        melhor_individuo_ja_visto = populacao[posicao]
        melhor_fitness_ja_visto = menor_fitness
        print(''.join(melhor_individuo_ja_visto), '- fitness:', melhor_fitness_ja_visto)
        
print()
print('Melhor estimativa de senha encontrada:')
print(''.join(melhor_individuo_ja_visto))

Progresso de geração de senhas convergindo para a melhor senha:
$Gd$M*E - fitness: 146
AX&&M*E - fitness: 132
%##%Os# - fitness: 108
%I%$DM# - fitness: 92
%##&%*# - fitness: 48
###%O## - fitness: 32
%#%$D#! - fitness: 24
%#%$D## - fitness: 22
##%$D## - fitness: 20
##%$C## - fitness: 19
##%$D&# - fitness: 17
##%$C&# - fitness: 16
!#%$C&# - fitness: 14
!#%#C&# - fitness: 13
!%%#C&# - fitness: 11
!%%#B&# - fitness: 10
!%%#B&$ - fitness: 9
!%$#B&$ - fitness: 8
!%$#A&$ - fitness: 7
!%$#A&% - fitness: 6
!%$#@&% - fitness: 5
!%$#@&* - fitness: 0

Melhor estimativa de senha encontrada:
!%$#@&*


## Conclusão



A partir de uma população com 100 senhas candidatas, é feita a seleção, cruzamento e mutação, a fim de identificar o melhor fit para o problema de minimização proposto, que consiste em encontrar dentro das senhas geradas aquela correspondente a senha previamente determinada, comparando a diferença entre cada um de seus caracteres, por meio de um torneio aleatório, até eleger aquela cuja diferença é zero, atingindo o critério de parada do algoritmo e retornando a senha encontrada.

Possíveis aplicações:

Este algoritmo pode ser aplicado na área de biologia, após identificar a sequência dos pares de base do DNA, conforme os quatro pares de base nitrogenadas (Adenina, Timina, Guanina, Citosina) e suas respectivas interações (A-T, G-C). Nesse sentido, pode ser verificada a correspondência desse DNA sequenciado com outro DNA previamente sequenciado, por meio da comparação em um banco de dados.
Outra possível aplicação é na área engenharia de materiais, na proposição de um novo material, em que após levantar as propriedades e os critérios necessários, comparar em bancos de dados, possíveis moléculas que atribuam as características requeridas para que o material desempenhe as funções especificadas.

Observações:
- O tamanho da população precisa ser maior que o número de combatentes, para não ocasionar o erro de população menor que a amostra;
- O algoritmo converge mais rapidamente se o tamanho da população é grande o suficiente para que ele possa realizar o cruzamento, a mutação, comparar as distâncias e eleger o melhor fit;
- A possibilidade de mutação aumenta a probabilidade de encontrar a senha, visto que pode alterar os caracteres de senhas com um fit ruim e que seriam descartadas;
- O operador de seleção é aleatório, se for selecionado o tamanho do torneio como 1, ele não terá com quem comparar e, então, ele não processará a operação como esperado;
- O código pode trabalhar com qualquer tipo de senha, visto que cada caractere possui um código universal que é interpretado pelo computador e, portanto esse código é específico de cada caractere, o que garante que esse algoritmo possa encontrar a senha correta.

## Playground

