Descobrindo a senha
===================



## Objetivo



Usar um algoritmo genético para descobrir uma senha.



## Descrição do problema



Neste problema, a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução (veja que isso é algo que não temos no mundo real. Nenhum site irá te dizer se você está acertando ou errando seu palpite). O critério de parada deste problema é quando a senha for descoberta.



## Importações



In [5]:
from funcoes import populacao_inicial_senha
from funcoes import funcao_objetivo_pop_senha
from funcoes import selecao_torneio_min
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_senha
import random

## Códigos e discussão



Neste experimento, exite um detalhe que pode torná-lo um pouco mais difícil: O fato de, na estrutura dos algoritmos genéticos, os genes serem letras ou caracteres, ao invés de números (como estávamos acostumados).
Sendo assim, nosso indivíduo é a própria senha já informada, composta por vários genes diferentes.
<p>
Para descobrir a senha correta, é necessário utilizar a distância dos caracteres possíveis em relação aos caracteres já informados. Quanto menor a distância, mais correta está a senha. A intenção é que essa distância seja 0, ou seja, temos um problema de MINIMIZAÇÃO!

In [6]:
### CONSTANTES

# relacionadas à busca
TAMANHO_POP = 50
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05
NUM_COMBATENTES_NO_TORNEIO = 3

# relacionadas ao problema a ser resolvido
SENHA = "Já comprou chocolates cacau show hoje?"
LETRAS_POSSIVEIS = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789!:@.´ `á?"
NUM_GENES = len(SENHA)

In [7]:
# funções locais

def cria_populacao_inicial(tamanho, tamanho_senha):
    return populacao_inicial_senha(tamanho, tamanho_senha, LETRAS_POSSIVEIS)

def funcao_objetivo_pop(populacao):
    return funcao_objetivo_pop_senha(populacao, SENHA)

def funcao_selecao(populacao, fitness):
    return selecao_torneio_min(populacao, fitness, NUM_COMBATENTES_NO_TORNEIO)

def funcao_mutacao(individuo):
    return mutacao_senha(individuo, LETRAS_POSSIVEIS)

In [8]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

melhor_fitness_ja_visto = float("inf")  # é assim que escrevemos infinito em python

print("Progresso da melhor senha já vista:")

while melhor_fitness_ja_visto != 0: 
    
    # Seleção
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    # Cruzamento
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        
        contador = contador + 2   
        
    # Mutação
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)            
            
    # melhor individuo já visto até agora
    fitness = funcao_objetivo_pop(populacao)
    menor_fitness = min(fitness)
    if menor_fitness < melhor_fitness_ja_visto:        
        posicao = fitness.index(menor_fitness)
        melhor_individuo_ja_visto = populacao[posicao]
        melhor_fitness_ja_visto = menor_fitness
        print("".join(melhor_individuo_ja_visto), "- fitness:", melhor_fitness_ja_visto)

print()
print("Melhor palpite da senha encontrado:")
print("".join(melhor_individuo_ja_visto))

Progresso da melhor senha já vista:
DlNaT5Vngxdmgtg9So?hvEHJgEfyIeXyZba6jP - fitness: 980
KpYNtFSmmoVghlR`4u0yr4d?gEfyIeXyZba6jP - fitness: 949
Yokyf8wunrTN:sqaWu0yr4d?gVg wVcE8Hjb1l - fitness: 917
DlNaT5VnQxdmgtg9So?hvEd?gVg wVcE8Hjb1l - fitness: 908
DlNaL vJmoVghlR`ZM0yr4d?gVg wVcE8Hjb1l - fitness: 891
DlNaL vJmoVghlR`ZM0yr4d?gVg wVzh9?Yu:I - fitness: 841
DlNaT5VnQxdmgtg9So?yr4d?eVg weXyZbajjP - fitness: 786
DlNaT5VnQxdmgtg9So?hvEdUgVg wVcuZbajjP - fitness: 772
DlNaf8wunrTmgtg`ZM0yr4d?gVg wVzuZbajjP - fitness: 680
DlNaf8wunrTmgtg`lM0yr4d?gVg wVzuZbajjP - fitness: 662
DlNaf8wunrTmgtg`So?hvEdUgVg wVcuZbajjP - fitness: 647
DlNaf8wunrTmgtg`lM0yr4dUgVg wVcuZbajjP - fitness: 641
DlNaf8wunrTmgtg`lM?hvEdUgVg wVcuZbajjP - fitness: 628
DlNaf8wunrTmgtg`lM?hsEdUgVg wVcuZbajjP - fitness: 625
DlNaf8wunrLmgtg`lM?hsEdUgVg wVcuZbajjP - fitness: 617
DlNaf8wunrLmgtg`lM?hsEdUgVg wVcuZbajj3 - fitness: 612
DlNaf8wunrLmgtg`lM?hvEdUgVg wVjuZbajj3 - fitness: 608
DlNaf8wunrLmgtg`lMphsEdUgVg wVcuZbajj3 - fitne

Comparado aos outros experimentos, esté código foi alterado em alguns aspectos para atender aos objetivos. Além de trabalharmos com caracteres e calcular a distância entre eles, algumas funções perderam utilidade neste problema, como a roleta máxima na função seleção (pois, estávamos tratando de um problema de minimização). Sendo assim, o melhor modelo de seleção foi o torneio, em que 3 indivíduos eram comparados e o invidivíduo com menor fitness era selecionado. Contudo, os outros indivíduos não eram descartados, apenas retornavam a "lista" de possíveis combatentes no torneio, ou seja, seguiam através das próximas gerações.
E ainda, existe o risco de selecionar o mesmo indivíduo mais de uma vez, visto que a população não deixa de ser a mesma.

Após rodar esse processo algumas vezes, obtém a senha correta, sendo a distância entre os caracteres = 0.

## Conclusão



Neste experimento, utilizamos nosso algoritmo genético para encontrar a senha correta, utilizando a distância entre palavras "varrendo" dígito a dígito.
Nós informamos nossa senha e quais são os caracteres possíveis, de modo que a comparação de caracteres começa em uma distância máxima de dígitos, e vai minimizando até que encontre a senha verdadeira. 

Nosso experimento, é um problema de minimização, ou seja, utilizaremos a soma do absoluto das diferenças como métrica, em que, por meio da função ___ord___, utilizada dentro da _função_objetivo_senha_, podemos transformar caracteres em números e verificar a distância entre eles.
    
Concluímos que o uso de algoritmos genéticos é um dos melhores métodos para encontrar senhas de N caracteres, em comparação com abordagens como busca em grade. A busca em grade exigiria um número muito grande de iterações, o que seria computacionalmente pesado.

Uma característica interessante desse código é a sua flexibilidade, permitindo modificações nas funções. Uma proposta de modificação discutida em sala de aula foi a mudança na função de mutação para permitir a mutação em nível de letra, em vez de palavra inteira, o que provavelmente aumentaria a eficiência do algoritmo.

Ao ajustar as constantes de busca, observamos que aumentar o número de gerações e o tamanho da população resulta em um aumento significativo no tempo de execução do código. No entanto, também aumenta a probabilidade de encontrar a senha correta. Portanto, é necessário encontrar um equilíbrio entre eficiência e probabilidade de sucesso.

Destacamos a importância da constante "NUM_COMBATENTES_NO_TORNEIO" no desempenho do código. Um valor maior para essa constante resulta em uma população mais homogênea. Observamos que valores maiores tendem a produzir resultados piores, provavelmente devido à perda de diversidade genética na população.

## Playground

