# Aula 1 - Machine Learning

## Demo 1 - Algoritmo Genético para construção de frase alvo

Começamos com um conjunto genérico de letras como nosso set de genes e uma "alvo" de destino, no caso uma frase. Poderiam ser também caracteres dentre outros tipos de dados.

Exemplo:

https://www.researchgate.net/publication/334279473_Aplicacao_de_Algoritmo_Genetico_para_Reconhecimento_de_Padroes_Roletas_de_Las_Vegas_e_Atlantic_City_a_Computacao_Natural)

In [1]:
geneSet = " abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!."
target = "hello world!"

## Generando um "palpite"

Em seguida, precisamos de uma maneira de gerar uma seqüência aleatória de letras a partir do conjunto de genes.

In [2]:
import random

def generate_parent(length):
    genes = []
    while len(genes) < length:
        sampleSize = min(length - len(genes), len(geneSet))
        genes.extend(random.sample(geneSet, sampleSize))
    return ''.join(genes)

random.sample pega valores sampleSize da entrada sem substituição. Isso significa que não haverá duplicatas no pai gerado, a menos que o geneSet contenha duplicatas ou o tamanho seja maior que len (geneSet). A implementação acima nos permite gerar uma longa string com um pequeno conjunto de genes, usando o maior número possível de genes únicos.

## Fitness

O valor de adequação ou adaptação que o algoritmo genético fornece é o único feedback que o mecanismo obtém para guiá-lo em direção
a uma solução. Nesse problema, nosso valor de adequação é o número total de letras no palpite que correspondem à letra
na mesma posição da senha.

In [3]:
def get_fitness(guess):
    return sum(1 for expected, actual in zip(target, guess)
               if expected == actual)

## Mutação

Também precisamos de uma maneira de produzir um novo palpite, alterando o atual. A implementação a seguir converte a string pai em uma matriz com list (parent), em seguida, substitui 1 letra na matriz selecionada aleatoriamente de geneSet e, em seguida, recombina o resultado em uma string com '' .join (genes).

In [4]:
def mutate(parent):
    index = random.randrange(0, len(parent))
    childGenes = list(parent)
    newGene, alternate = random.sample(geneSet, 2)
    childGenes[index] = alternate \
        if newGene == childGenes[index] \
        else newGene
    return ''.join(childGenes)

Essa implementação usa uma substituição alternativa se o newGene selecionado aleatoriamente for o mesmo que o que
deve substituir, o que pode economizar uma quantidade significativa de sobrecarga.

## Display

Em seguida, é importante monitorar o que está acontecendo, para que possamos parar o mecanismo se ele ficar preso. Também nos permite aprender o que funciona e o que não funciona para que possamos melhorar o algoritmo.

Vamos exibir uma representação visual da sequência do gene, que pode não ser a seqüência do gene literal, seu valor de adequação e quanto tempo se passou.

In [5]:
import datetime

def display(guess):
    timeDiff = datetime.datetime.now() - startTime
    fitness = get_fitness(guess)
    print("{0}\t{1}\t{2}".format(guess, fitness, str(timeDiff)))

## Main

Agora estamos prontos para escrever o programa principal. Começamos inicializando o bestParent com uma sequência aleatória de letras.

In [6]:
random.seed()
startTime = datetime.datetime.now()
bestParent = generate_parent(len(target))
bestFitness = get_fitness(bestParent)
display(bestParent)

qVplIxZ!PzeN	1	0:00:00.000187


Então nós adicionamos o coração do motor genético. É um loop que gera um palpite, solicita a adequação para esse palpite, compara-o ao do palpite anterior e mantém o melhor dos dois. Este ciclo se repete até que todas as letras coincidam com as do alvo.

In [7]:
i = 0
while True:
    i=i+1
    child = mutate(bestParent)
    childFitness = get_fitness(child)

    if bestFitness >= childFitness:
        continue
    display(child)
    if childFitness >= len(bestParent):
        break
    bestFitness = childFitness
    bestParent = child
print(i)

qVplIxw!PzeN	2	0:00:00.009479
qVplIxw!rzeN	3	0:00:00.010213
qVplI w!rzeN	4	0:00:00.011110
qVplI w!rleN	5	0:00:00.014172
hVplI w!rleN	6	0:00:00.014606
hVllI w!rleN	7	0:00:00.016241
hVllI w!rle!	8	0:00:00.017443
hVllI worle!	9	0:00:00.019303
hVllI world!	10	0:00:00.019542
hVllo world!	11	0:00:00.020878
hello world!	12	0:00:00.023943
1487


Sucesso!

Parabéns, você acaba de construir seu primeiro Algoritmo Genético em Python.