Descobrindo a senha
===================



## Objetivo



Usar um algoritmo genético para descobrir uma senha.



## Descrição do problema



Neste problema, a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução (veja que isso é algo que não temos no mundo real. Nenhum site irá te dizer se você está acertando ou errando seu palpite). O critério de parada deste problema é quando a senha for descoberta.



## Importações



In [1]:
# Funções e bibliotecas necessárias para o funcionamento do algorítimo

from funcoes import populacao_inicial_senha
from funcoes import funcao_objetivo_pop_senha
from funcoes import selecao_torneio_min
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_senha
import random

## Códigos e discussão



In [2]:
# Constantes relacionadas a busca

TAMANHO_POP = 50  #Define o tamanho da população inicial que desejamos
CHANCE_CRUZAMENTO = 0.5  # Porcentagem que define a chance na qual determinados genes serão passados. Também define que os cruzamentos serão feitos em pares e sem ultrapassar a quantidade total de individuos da população
CHANCE_MUTACAO = 0.05 # Porcentagem de ocorrer uma mutação em um gene e alterar o seu valor
NUM_COMBATENTES_NO_TORNEIO = 3

# relacionadas ao problema a ser resolvido
SENHA = "correcthorsebatterystaple"
LETRAS_POSSIVEIS = "abcdefghijklmnopqrstuvwxyz"
NUM_GENES = len(SENHA)

Para a construção das funções e começarmos a moldar o progresso do nosso algoritmo, primeiro precisamos entender o problema. Temos uma senha e queremos encontrá-la, mas não podemos simplesmente passá-la para o algoritmo, temos que construir esta interação entre senha-palpite e senha original de tal forma que a função objetivo nos indique o quão próximo estamos de desvendar a senha. Sabemos que a função objetivo nos retorna um valor de fitness, logo, como o fitness poderia representar que a senha-palpite está próxima da senha original?

**Distância**

Ora, a senha original é composta de letras, onde cada uma será um gene do indivíduo. Se o nosso algoritmo construir uma senha formada pelas letras possíveis do alfabeto, de forma aleatória, ele pode checar a distância de um gene (letra) com relação à um gene de mesmo índice do indivíduo que contém a senha correta, e então o valor distância entre todos os genes dos indivíduos palpite e correto será o fitness daquele indivíduo.

In [3]:
# Funções Locais

def cria_populacao_inicial(tamanho, tamanho_senha):
    return populacao_inicial_senha(tamanho, tamanho_senha, LETRAS_POSSIVEIS)

def funcao_objetivo_pop(populacao):
    return funcao_objetivo_pop_senha(populacao, SENHA)

def funcao_selecao(populacao, fitness):
    return selecao_torneio_min(populacao, fitness, NUM_COMBATENTES_NO_TORNEIO)

def funcao_mutacao(individuo):
    return mutacao_senha(individuo, LETRAS_POSSIVEIS)

In [4]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

melhor_fitness_ja_visto = float("inf")  # é assim que escrevemos infinito em python

print("Progresso da melhor senha já vista:")

while melhor_fitness_ja_visto != 0:
    
    # Seleção
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    # Cruzamento
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        
        contador = contador + 2   
        
    # Mutação
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)            
            
    # melhor individuo já visto até agora
    fitness = funcao_objetivo_pop(populacao)
    menor_fitness = min(fitness)
    if menor_fitness < melhor_fitness_ja_visto:        
        posicao = fitness.index(menor_fitness)
        melhor_individuo_ja_visto = populacao[posicao]
        melhor_fitness_ja_visto = menor_fitness
        print("".join(melhor_individuo_ja_visto), "- fitness:", melhor_fitness_ja_visto)

print()
print("Melhor palpite da senha encontrado:")
print("".join(melhor_individuo_ja_visto))

Progresso da melhor senha já vista:
clhpbszckyadajzxhntfrgmnf - fitness: 134
brsyhmpfsmivebvelswvjdjrk - fitness: 132
brsyhmphsumrhjzxhntfrgmnf - fitness: 119
brsyhmpfvrikajzxhntfrgmnf - fitness: 113
brsyhmpfvrikajzxhswvjdjrf - fitness: 109
brsyhmpfyndcfbtslswvjdjrf - fitness: 107
brsyhmpfvrnkajzxhswvjdjrf - fitness: 104
brsyhmpfvrnkajzxhswvjgmnf - fitness: 100
brsyhmpfvrnkfbtslswvjdjrf - fitness: 94
brsyhmpfvrnkfbtslswvjdjnf - fitness: 90
brsyhmpfvrnkfbtslswvjdmnf - fitness: 87
brsyhmpfvrnafbtslswvjdmnf - fitness: 85
brsyhmpfvrnkfbtslswvudmnf - fitness: 78
brsyhepfvrnafbtslswvjdmnf - fitness: 77
brsyhepfvrnafbtslswvudmnf - fitness: 68
brsyhepfvrnafbtslswuudmnf - fitness: 67
brsyhepfsrnafbtslswvudmnf - fitness: 65
brsyhepfvrnabbtslswvudmnf - fitness: 64
brsyhepfsrnabbtslswvudmnf - fitness: 61
brsyhepfvrvabbtsgswvudmnf - fitness: 57
brsyhepfsrnabbtsgswvudmnf - fitness: 56
brsyeepfsrnabbtsgswvudmnf - fitness: 53
brsyeepfsrnabbtsgswvudmne - fitness: 52
brsyeepfsrvabbtsgswvudmnf - fitness:

## Conclusão



Agora, abordamos o problema de descobrirmos uma senha. Aqui, no entanto, teremos a senha correta passada para a função objetivo, para que as senhas que o algoritmo encontrar como candidato, seja comparada com a senha original e assim dê um valor de fitness baseado na diferença entre as senhas.

Logo, fica claro que o que estamos analisando é um problema de minimização, pois queremos a menor distância entre o indivíduo conténdo os genes (letras) e as letras da senha original.

E assim, enquanto o critério de parada não for atingido, realizamos a construção de novas populações de indivíduos e checamos o fitness (distancia) da senha que o individuo representa, até quando a distância entre todos os genes dos individuos seja 0, que representa que o individuo candidato corresponde ao individuo que é a senha correta

Com isso, vimos que este experimento teve um grau de complexidade mais elevada do que os anteriores, necessitando que novas funções fossem criadas para atender os requisitos para a solução do problema. O método da função objetivo desta vez foi o contrário do que o do experimento anterior, pois neste comparamos as letras candidatas e as letras originais, e desejamos que a distância seja 0 entre elas, significando que a letra candidata corresponde à letra original. Ou seja, tratamos aqui de um problema de minimização, pois queremos a menor distância possível entre as letras, e no experimento anterior o problema tratado envolvia maximização. O algoritmo também apresenta caráter probabilístico, pois apesar de não termos um gerador de populações, temos um loop que irá gerar um indivíduo contendo letras aleatoriamente, e assim irá comparar com a senha original.

## Playground

