Descobrindo a senha
===================



## Objetivo



Usar um algoritmo genético para descobrir uma senha.



## Descrição do problema



Neste problema, a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução (veja que isso é algo que não temos no mundo real. Nenhum site irá te dizer se você está acertando ou errando seu palpite). O critério de parada deste problema é quando a senha for descoberta.



## Importações



In [1]:
from funcoes import populacao_inicial_senha
from funcoes import funcao_objetivo_pop_senha
from funcoes import selecao_torneio_min
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_senha
import random

## Códigos e discussão



<h4 style='text-align:justify'> GERAL </h4>
<p style="text-align: justify"> O problema abordado é a respeito da identificação da senha correta e quantificação do quão perto ou longe está o palpite do algoritmo para a determinação da senha correta estabelecida. O critério de parada deste problema é quando a senha for descoberta. Logo, de modo a solucionar o problema, as questões que norteam são: Quais analogias e estratégias podem ser utilizados para a resolução deste problema? Os algorítmos genéticos conseguem abordar uma solução para esta problemática?  </p>
<p style="text-align: justify"> Pois bem! As respostas para os nossos questionamentos são afirmativaa! Retomando o abordado em outros notebooks, os Algoritmos Genéticos são baseados nas concepções de evolução darwiniana, sendo representada, de modo sintetizado, por três operadores: Seleção, Cruzamento e Mutação. Esses operadores nos permitem realizar operações probabilisticas que determinam a melhor aptidão (fitness) do nosso algoritimo, esse fitness é determinado pela função objetiva do nosso código e como o nosso problema deseja identificar se a senha feita pelo algoritmo é igual a senha correta, a utilização do fitness para determinação do melhor palpite é uma das melhoras estratégias a serem utilizadas. </p>
<p style="text-align: justify"> E como esse fitness pode ser utilizado? Acoplando a ideia do fitness de um gene a um sistema de torneio, conseguimos utilizar uma estratégia de distância, isto é, se o nosso algoritmo desenvolver um senha inicial aleatória é possível comparar a distância de um gene (letra) em relação a um gene do mesmo índice da senha correta, logo, quanto menor for a distância entre os índices do gene (n=0) melhor é o palpite e mais próximo estamos da senha verdadeira. Vamos ver um pouco mais sobre essa lógica? </p>


<h4 style='text-align:justify'> PASSO 1 </h4>
<p style="text-align: justify"> De modo a realizar o algoritmo genético, determina-se as constantes gerais do problema como o tamanho da população, número de gerações, a probabilidade de cruzamento e mutação, além do número de genes(letras) que serão utilizados no torneio para compararmos quais das letras apresentam o menor fitness para a resolução do problema.  </p>

In [2]:
### CONSTANTES
# relacionadas à busca
TAMANHO_POP = 50
NUM_GERACOES = 2000
CHANCE_CRUZAMENTO = 0.5
CHANCE_MUTACAO = 0.05
NUM_COMBATENTES_NO_TORNEIO = 3

# relacionadas ao problema a ser resulvido
SENHA = "danielejoaomelhorescarecasilum"
LETRAS_POSSIVEIS = "abcdefghijklmnopqrstuvwxyz"
NUM_GENES = len(SENHA)

<h4 style='text-align:justify'> PASSO 2 </h4>
<p style="text-align: justify"> Em seguida, desenvolve-se as funções locais para geração da população inicial - formada a partir das constantes determinadas; a função objetivo da população - uma função que recebe um indivíduo e retorna o seu valor de aptidão;  a função de seleção - dado o valor de aptidão determina-se quais genes vão ir para as seguintes gerações; e a função de mutação. </p>

In [3]:
# funções locais

def cria_populacao_inicial(tamanho, tamanho_senha):
    return populacao_inicial_senha(tamanho, tamanho_senha, LETRAS_POSSIVEIS)

def funcao_objetivo_pop(populacao):
    return funcao_objetivo_pop_senha(populacao, SENHA)

def funcao_selecao(populacao, fitness):
    return selecao_torneio_min(populacao, fitness, NUM_COMBATENTES_NO_TORNEIO)

def funcao_mutacao(individuo):
    return mutacao_senha(individuo, LETRAS_POSSIVEIS)

<h4 style='text-align:justify'> PASSO 3 </h4>
<p style="text-align: justify"> Estabelecidas as constantes e funções, a primeira linha de código é responsável pela criação da população a partir das constantes estabelecidas, isto é, uma população com tamanho máximo de 50 individuos e com os seus genes limitados ao tamanho total da senha. Após a criação da população, estabelece-se o fitness como infinito e como o nosso problema é caracterizado como um problema de minimização, queremos encontrar o fitness com menor número (n=0). Em seguida, o nosso código irá percorrer em loop pelo número total de gerações estabelecido inicialmente, de modo aos indivíduos que formaram a população troquem as informações dos seus genes segundo o cruzamento estabelecido, que possibilita formar novos indivíduos que podem possuir tanto as melhores como as piores características dos indivíduos iniciais. Ademais, com o intuito de aumentar a variabilidade genética, inclui-se o operador de mutação que é responsável por alterar determinadas partes aleatórias do gene do indivíduo de forma a buscar uma melhoria do indivíduo gerado. </p>
<p style="text-align: justify"> Todo o processo é avaliado pelo fitness, uma função que recebe um indivíduo e retorna o seu valor de aptidão. Esse valor de aptidão é obtido através da comparação entre o indice da senha gerada atualmente e o da senha correta, utiliza-se do algoritmo de torneio afim de avaliar qual das letras apresenta melhor aptidão. Esse processo de comparação foi desenvolvido da função "ord" que nos permite transformar caracteres em números e verificar a distância entre eles. Em nosso problema de minimização, desejamos obter o menor fitness (distância) de modo a encontrar a senha correta.  </p>

In [4]:
populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES)

melhor_fitness_ja_visto = float("inf")  # é assim que escrevemos infinito em python

print("Progresso da melhor senha já vista:")

for n in range(NUM_GERACOES):    
    
    # Seleção
    fitness = funcao_objetivo_pop(populacao)
    populacao = funcao_selecao(populacao, fitness)
    
    # Cruzamento
    pais = populacao[0::2]
    maes = populacao[1::2]
    
    contador = 0
    
    for pai, mae in zip(pais, maes):
        if random.random() <= CHANCE_CRUZAMENTO:
            filho1, filho2 = funcao_cruzamento(pai, mae)
            populacao[contador] = filho1
            populacao[contador + 1] = filho2
        
        contador = contador + 2   
        
    # Mutação
    for n in range(len(populacao)):
        if random.random() <= CHANCE_MUTACAO:
            individuo = populacao[n]
            populacao[n] = funcao_mutacao(individuo)            
            
    # melhor individuo já visto até agora
    fitness = funcao_objetivo_pop(populacao)
    menor_fitness = min(fitness)
    if menor_fitness < melhor_fitness_ja_visto:        
        posicao = fitness.index(menor_fitness)
        melhor_individuo_ja_visto = populacao[posicao]
        melhor_fitness_ja_visto = menor_fitness
        print("".join(melhor_individuo_ja_visto), "- fitness:", melhor_fitness_ja_visto)

print()
print("Melhor palpite da senha encontrado:")
print("".join(melhor_individuo_ja_visto))

Progresso da melhor senha já vista:
hrngslajjoukenmekklnpghdxtmjel - fitness: 193
edshmtlcpnrmhunporofjixinubdyu - fitness: 184
edngslajjoukenmekkgdjixinubbuw - fitness: 179
edshmlajjoukenmekkgdjizaleiwtj - fitness: 173
edngslajwoukenmqcatdcezaleiwtj - fitness: 162
edshmlajjoukenmekatdcezaleiwtj - fitness: 157
edngslajjoukenmekkofjihfffiwtj - fitness: 145
edngslajhhgmenmekkofjihfffiwtj - fitness: 140
edngslajhhgmcnmqkkofjihfffiwtj - fitness: 134
edngslajhhgmenmquaofjihfffiwtj - fitness: 126
edngslajhhgmenmquatdjihfffiwtj - fitness: 121
edngslajjhgmenmquatdjihfffiwtj - fitness: 119
edngslajjhgmenmquatdcehfffiwtj - fitness: 116
edngslajjhgmenmquatdjqhfffiwtj - fitness: 111
edngslajjhgmenmquetdjqhfffiwtj - fitness: 107
ebngslajjhgmenmquetdjqhfffiwtj - fitness: 105
edngplajjhgmenmquetdjqhfffiwtj - fitness: 104
edngslajjhgmenmquetdjqhfffijtj - fitness: 98
edngplajjhgmenmquetdjqhfffijxj - fitness: 97
edngplajjhgmenmquetdjqhffsiwtj - fitness: 91
edngelajjhgmenmquetdjqhfffijxj - fitness: 86
ed

## Conclusão
<p style="text-align: justify"> Ao se falar a respeito de algoritmos genéticos, em um primeiro momento, há a impressão de que estes são aplicados apenas a situações problemas de caráter biológico. Entretanto, apesar deles serem voltados a esta categoria, eles não são restritos a resolução destas ocorrências e o presente experimento demonstra a possibilidade de utilização em outras áreas, porque de modo sintetizado, este algoritmo está relacionado com busca e pesquisa - se destoando dos gerais ao trabalhar com a codificação do conjunto de parâmetros e não com os próprios parâmetros, além de trabalharem com uma população e serem propabilisticos; o importante é entender o seu contexto geral e adapta-lo para o nosso objetivo! Em nosso contexto, temos uma situação-problema em que a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução. </p>
<p style="text-align: justify"> Pensando nessa situação, o que podemos utilizar de conceitos de algoritmos genéticos? A fim de relacionar os conceitos, vamos pensar no problema de forma similar a um problema genético, isto é, queremos um indivíduo cujo genes corresponderão a um conjunto de genes já conhecidos (as senhas), e queremos realizar uma comparação entre um número de n de genes para ver qual a menor distância de combinações para termos que o nosso gene aleatório seja igual ao nosso gene já conhecido (a senha), logo, observa-se um problema de minimização.    Ainda dissertando a respeito dos algoritmos genéticos, este notebook nos permite identificar a versatilidade destes, nos permitindo desenvolver problemas de maximização e de minimização. </p>
<p style="text-align: justify"> Agora pensando em algoritmos genéticos e problemas de minimização, a melhor estratégia a ser utilizada é por meio da função fitness que determina o valor do quão bem cada individuo consegue resolver este ambiente, em um viés biológico, ele demonstra um valor que nos permite identificar o quão adaptado o individuo está no ambiente com o qual ele se desenvolve. Essa mensuração é muito interessante, porque nos dá um parametro de quão bem está o nosso "chute" para a identificação da senha já determinada. Outra função importante é a de torneio, pois através dela que se faz um comparativo entre as letras (uma espécie de competição!) para analisar o quão próximas estas estão da nossa resposta desejada, ademais, o torneio é bem interessante porque o combate nunca termina em "morte" ou "descarte" do individuo, já que ele pode retornar em outro momento, em um grupo de possíveis combatentes.  
</p>

## Playground



Muito obrigada pela aula, Dani :)