Descobrindo a senha
===================



## Objetivo



Usar um algoritmo genético para descobrir uma senha.



## Descrição do problema



Neste problema, a função objetivo deve saber a senha correta e quantificar de alguma maneira o quão perto ou longe os palpites estão da solução (veja que isso é algo que não temos no mundo real. Nenhum site irá te dizer se você está acertando ou errando seu palpite). O critério de parada deste problema é quando a senha for descoberta.



## Importações



In [1]:
import random
from funcoes import populacao_ds
from funcoes import selecao_por_torneio_ds as funcao_selecao
from funcoes import cruzamento_ponto_simples as funcao_cruzamento
from funcoes import mutacao_ds
from funcoes import numero_para_caractere_individuo_ds
from funcoes import senha_aleatoria_ds

## Códigos e discussão



In [2]:
# Passo a passo planejado

# Vou trabalhar preferencialmente com números e convertê-los para caracteres somente no print

# Criar uma função que entra um caractere e retorna o seu número correspondente
# Criar uma função que entra um número e retorna o seu caractere correspondente
# Criar uma função que gera uma senha de tamanho n aleatoriamente usando um conjunto de caracteres
# Criar uma função que cria cada gene do indivíduo (caractere da senha)
# Criar uma função que cria um indivíduo a partir dos caracteres disponíveis
# Criar uma função que cria uma população a partir de um conjunto de indivíduos
# Criar uma função que calcula a função objetivo de cada indivíduo
# Criar uma função que calcula o fitness de cada indivíduo da população e armazena em uma lista
# Criar uma função seleção por torneio
# Criar uma função cruzamento
# Criar uma função mutação

# Tentar variar as funções de cruzamento
# Tentar implementar o cruzamento ponto duplo ou o cruzamento uniforme

# problemas: encontrar o mínimo da função fitness, isso será alterado na seleção

In [3]:
# constantes de busca
TAMANHO_POP = 12 # quantidade de indivíduos
NUM_GERACOES = 10000 # número de gerações
CHANCE_DE_COMPETIR_IND = 0.5 # chance que cada indivíduo tem de ser chamado para o torneio
CHANCE_CRUZAMENTO = 0.5 # chance de ocorrer o cruzamento entre dois indivíduos
CHANCE_MUTACAO = 0.02 # chance de ocorrer mutação em cada indivíduo durante cada geração

# constantes de problema
CARACTERES_STR = "QWERTYUIOPASDFGHJKLÇZXCVBNMqwertyuiopasdfghjklçzxcvbnm1234567890" # caracteres disponíveis em str para facilitar a digitação
CARACTERES = list(CARACTERES_STR) # lista com todos os caracteres disponíveis
NUM_GENES = 10 # número de genes ou tamanho da senha

In [4]:
# funções locais

def cria_populacao_inicial(tamanho, numero_genes): # torna a função populacao_ds independente dos caracteres disponíveis
    return populacao_ds(tamanho, numero_genes, CARACTERES)

def funcao_mutacao(individuo): # torna a função mutacao_ds independente dos caracteres disponíveis
    return mutacao_ds(individuo, CARACTERES)

In [5]:
senha = senha_aleatoria_ds(NUM_GENES, CARACTERES) # cria uma senha aleatória

print('A senha sorteada foi:', "".join(senha)) # mostra qual foi a senha criada

print()

populacao = cria_populacao_inicial(TAMANHO_POP, NUM_GENES) # cria aleatoriamente uma população inicial

print('População inicial:') # mostra qual foi a população criada aleatoriamente
for i, ind in enumerate(populacao):
    print('Individuo ', i+1, ': ', "".join(numero_para_caractere_individuo_ds(ind)))
    
for _ in range(NUM_GERACOES): # loop que começa a rodar cada geração
    
    # Única alteração na estrutura do código
    populacao = funcao_selecao(populacao, CHANCE_DE_COMPETIR_IND, senha) # Tem a função de sortear individuos na população e troca-los pelo melhor entre eles
    
    pais = populacao[0::2] # definição dos indivíduos que serão pais
    maes = populacao[1::2] # definição dos indivíduos que serão mães
    contador = 0 # estratégia para colocar os filhos no lugar dos pais
    for pai, mae in zip(pais, maes): # laço de repetição para pegar itens da lista de pais e mães
        if random.random() < CHANCE_CRUZAMENTO: # aplicando a possibilidade de cruzamento
            # vai acertar o cruzamento
            filho1, filho2 = funcao_cruzamento(pai, mae) # "calculando" o filho 1 e o filho 2
            populacao[contador] = filho1 # trocando o pai pelo filho 1
            populacao[contador + 1] = filho2 # trocando a mãe pelo filho 2
            
        contador = contador + 2 # atualização do contador
    
    for n in range(len(populacao)): #laço de repetição para mutação
        if random.random() <= CHANCE_MUTACAO: # chance de mutação
            individuo = populacao[n] # escolhe o indivíduo
            populacao[n] = funcao_mutacao(individuo) # muta o indivíduo
        
print()
print('População final:') # mostra qual foi a população final selecionada geneticamente
for i, ind in enumerate(populacao):
    print('Individuo ', i+1, ': ', "".join(numero_para_caractere_individuo_ds(ind)))

A senha sorteada foi: HOpDmGPDDV

População inicial:
Individuo  1 :  M18OjHdgTj
Individuo  2 :  CclBnAafYd
Individuo  3 :  O3XuMkYSiK
Individuo  4 :  tÇ9nV30SSq
Individuo  5 :  vzshoe8Pxw
Individuo  6 :  mjuUQdU3fC
Individuo  7 :  FGHLVZVWJL
Individuo  8 :  GXdbYsBews
Individuo  9 :  uçDamx1BLR
Individuo  10 :  xdnOOU6XQt
Individuo  11 :  qVmVDzmcMP
Individuo  12 :  i2BNJsZVpa

População final:
Individuo  1 :  HOpDmpPDDV
Individuo  2 :  HOpDmGPDDV
Individuo  3 :  HOpDmGPDDV
Individuo  4 :  HOpDmGPDDV
Individuo  5 :  HOpDmGPDDV
Individuo  6 :  HOpDmGPDDV
Individuo  7 :  HOpDmGPDDV
Individuo  8 :  HOpDmGPDDV
Individuo  9 :  HOpDmpPDDV
Individuo  10 :  HopDmGPDDV
Individuo  11 :  HOpDmGPDDV
Individuo  12 :  HOpDmGPDDV


## Conclusão



O problema descobrindo a senha é um ótimo exemplo para as vantagens de se usar os Algoritmos Genéticos, pois, se a resposta fosse ser testada por grade, haveria um número de possibilidades igual ao tamanho da senha elevado ao número de caracteres disponíveis, ou seja, incontáveis possibilidades, impossibilitando também uma busca aleatória, no entanto, ao programar um algoritmo genético, é possível descobrir, ou pelo menos chegar muito perto da resposta com pouquíssimo gasto computacional. Para mim, além do aprendizado, a conclusão desse algoritmo foi um desafio em que eu pude trabalhar a minha criatividade e organização.


## Observações:

Daria para adicionar a existência de um indivíduo que responde corretamente à senha parando a iteração quando a função objetivo de um dos individuos resultasse em zero, sendo esse indivíduo correspondente à senha correta. Além disso, seria possível mudar a função objetivo, de forma a considerar a soma dos quadrados dos erros cometidos, talvez essa estratégia faria com que a resposta fosse encontrada com um número menor de gerações, mas poderia diminuir a diversidade.

## Playground



In [6]:
import random as rd

In [7]:
def gene_ds(valor_max_caixa):
    """Gera um gene válido para o problema descobrindo a senha
    
    Args:
        valor_max_caixa: Valor máximo que a caixa pode assumir
    
    Return:
        Um valor entre zero e o máximo.
    """
    gene = rd.randint(0, valor_max_caixa)
    return gene

In [8]:
gene_ds(10)

2

In [9]:
INDIVIDUO = [3, 8, 5, 2]
SENHA = [2, 9, 4, 1]

def funcao_objetivo_ds(individuo, senha):
    """Computa qual é a função objetivo do problema descobrindo a senha
    
    Args:
        individuo: lista contendo os genes das caixas não binárias
        senha: a senha verdadeira
        
    Return:
        Um valor representando o erro médio quadrado do indivíduo
    """
    fitness = 0
    for i in range(len(individuo)):
        fitness = fitness + (individuo[i] - senha[i])**2
    return fitness

funcao_objetivo_ds(INDIVIDUO, SENHA)

4

In [10]:
def caracteres_para_numeros(caracteres):
    """Cria uma função que converse caracteres para números
    
    Args:
        caracteres: uma lista com todos os caracteres que poderão ser utilizados
         
    Return:
        uma lista com os valores em números dos caracteres
    """
    numeros = []
    for caractere in caracteres:
        numero = ord(caractere)
        numeros.append(numero)
    
    return numeros

In [11]:
abs(-2)

2

In [12]:
rd.random() > 0.3

True

In [13]:
POPULACAO = [[4, 1, 3], [2, 12, 8], [9, 3, 4], [14, 18, 1]]
SENHA = ["A", "b", "r"]
CHANCE_DE_PARTICIPAR = 0.5

from funcoes import selecao_por_torneio_ds

In [14]:
selecao_por_torneio_ds(POPULACAO, CHANCE_DE_PARTICIPAR, SENHA)

[[4, 1, 3], [2, 12, 8], [9, 3, 4], [14, 18, 1]]

In [15]:
asa = "siaiujaikpodkasihiuaei"

In [16]:
list(asa)

['s',
 'i',
 'a',
 'i',
 'u',
 'j',
 'a',
 'i',
 'k',
 'p',
 'o',
 'd',
 'k',
 'a',
 's',
 'i',
 'h',
 'i',
 'u',
 'a',
 'e',
 'i']