Descobrindo a senha
===================



## Objetivo



Usar um algoritmo genético para descobrir uma senha.



## Descrição do problema



Neste problema, a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução (veja que isso é algo que não temos no mundo real. Nenhum site irá te dizer se você está acertando ou errando seu palpite). O critério de parada deste problema é quando a senha for descoberta.



## Importações



In [1]:
from funcoes import populacao_inicial_senha
from funcoes import funcao_objetivo_pop_senha
from funcoes import selecao_torneio_min
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_senha
import random

## Códigos e discussão



Para esse novo problema, na qual sabendo as características de um determinado indivíduo queremos encontrá-la, grande parte das funções importadas são basicamente as mesmas que dos experimentos anteriores, mudando apenas o fato de que foram adaptadas para esse problema.

Nesse sentido, uma função que cria a população inicial que antes no problema das caixas binárias possuía indivíduos que tinha genes que iam de 0 a 1 ou de 0 a 100, no problema das caixas não-binárias, agora possuem gene que podem ser as letras do alfabeto armazenadas na constante `LETRAS_POSSIVEIS`.

Vale ressaltar, também, que diferentemente do experimento anterior, onde tratávamos de um problema de maximização, o experimento A.05 trata-se de um experimento de minimização, pois queremos minimizar a distância entre as senhas.

In [2]:
# constantes relacionadas à  busca

# pode mudar para melhorar a eficácia do algoritmo construído
TAMANHO_POP = 5
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05
NUM_COMBATENTES_NO_TORNEIO = 3


# constantes relacionadas ao problema

# se forem alteradas, alteramos consequentemente o problema
# que está sendo resolvido
SENHA = "supercientista"
LETRAS_POSSIVEIS = "abcdefghijklmnopqrstuvwxyz"
NUM_GENES = len(SENHA)


É importante ressaltar também que para fazer essa medição da distância entre as palavras foi utilizada nas funções criadas no arquivo `funcoes.py` a função `ord` muito utilizada para converter letras em números.

Assim, o conceito utilizado para calcular a distância total a que estão 2 palavras devemos somar a diferença do valor de cada uma das letras da palavra que temos para a palavra que queremos.

Já para selecionar os indivíduos, a função `selecao_roleta_max` foi substituída pela função `selecao_torneio_min`(tendo em vista que agora trata-se de um problema de minimização).

A seleção por torneio funciona de modo que são sorteados $n$ indivíduos da população e selecionado o que tiver o melhor valor de fitness.

In [3]:
# funções locais
#cração de funções locais que são modificação das funções gerais já definidas

def cria_populacao_inicial(tamanho, tamanho_senha):
    return populacao_inicial_senha(tamanho, tamanho_senha, LETRAS_POSSIVEIS)

def funcao_objetivo_pop(populacao):
    return funcao_objetivo_pop_senha(populacao, SENHA)

def funcao_selecao(populacao, fitness):
    return selecao_torneio_min(populacao, fitness, NUM_COMBATENTES_NO_TORNEIO)

def funcao_mutacao(individuo):
    return mutacao_senha(individuo, LETRAS_POSSIVEIS)

O restante do código assemelha-se bastante com toda a implementação que já fizemos anteriormente nos outros notebooks, apresentando como novidade o `melhor_individuo_ja_visto`, chamado em outros contextos de "hall da fama", nada mais é do que uma variável que armazena os $n$ melhores indivíduos vistos até o momento, como nesse caso $n$ = 1, tratamos do melhor indivíduo encontrado até o momento.

In [4]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

melhor_fitness_ja_visto = float("inf") # infinito em python

print("Progresso da melhor senha já vista:")

while melhor_fitness_ja_visto != 0:
    
    # Seleção
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    # Cruzamento
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador+1] = filho2
            
        contador = contador + 2
        
    # Mutação
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)
            
    # Melhor indivíduo já visto até o momento
    fitness = funcao_objetivo_pop(populacao)
    menor_fitness = min(fitness)
    if menor_fitness < melhor_fitness_ja_visto:
        posicao = fitness.index(menor_fitness)
        melhor_individuo_ja_visto = populacao[posicao]
        melhor_fitness_ja_visto = menor_fitness
        print("".join(melhor_individuo_ja_visto), "-fitness", melhor_fitness_ja_visto)
        
print()
print("Melhor palpite da senha encontrado:")
print("".join(melhor_individuo_ja_visto))

Progresso da melhor senha já vista:
tvflcfhpharnpp -fitness 107
tvflcfhphcrnpp -fitness 105
tvflufhphcrnpp -fitness 93
tvflufhphcrnpl -fitness 89
tvflufhdhcrnpl -fitness 79
tvflufhdhvrnpl -fitness 64
tvflufhdhvrnpa -fitness 53
tvflufhdpvrnpa -fitness 49
tvflufhdpvrppa -fitness 47
tvfluahdpvrppa -fitness 46
svfluahdpvrppa -fitness 45
svgluahdpvrppa -fitness 44
svgluahdpvoppa -fitness 41
svoluahdpvoppa -fitness 33
swoduahdpvoppa -fitness 28
swoduahdpvopra -fitness 26
swoduahdpvhpra -fitness 21
swoduahdmvhpra -fitness 20
swojsahdmvhssa -fitness 18
swocsdhdkvhsta -fitness 15
suqdsdhdsvhsta -fitness 14
supdsdhdsvhsta -fitness 13
supdsdhdsuhsta -fitness 12
supdsdhdouhsta -fitness 8
supesbhdouhsta -fitness 7
supesbhdothsta -fitness 6
supesbhdnthsta -fitness 5
supfrcientirtc -fitness 4
supercientirtc -fitness 3
surercientista -fitness 2
supercientistb -fitness 1
supercientista -fitness 0

Melhor palpite da senha encontrado:
supercientista


## Conclusão



Dessa forma, a implementação de um algoritmo genético para encontrar uma senha conhecida e quantificar quão perto ou quão longe os palpites estão da solução foi um sucesso, pois conseguimos sim medir esse fitness e ir diminuindo essa distância até encontrarmos a melhor resposta.

Nesse experimento pudemos aprender também um pouco sobre como funcionam problemas de minimização, essa nova peça na aprendizagem com certeza nos abrirá a possibilidade de resolver todo um novo conjunto de problemas utilizando algoritmos genéticos, mal posso esperar pelos próximos experimentos!&#x1F604;

## Playground

