# hello world problem

### Chapter 1 of the book Genetic Algorithms with Python by [Clinton Sheppard](https://www.amazon.com/Genetic-Algorithms-Python-Clinton-Sheppard/dp/1540324001)

### Genes

Para começar, o algoritmo genético precisa de um conjunto de genes para usar na construção de palpites. Para este projeto, será um conjunto genérico de letras. Também precisa de uma senha de destino para adivinhar:

In [12]:
geneSet = " abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ!."
target = "Hello World!"

### import libraries

Importando as bibliotecas random e datetime

In [13]:
import random 
import datetime

### Generate a guess

Em seguida, o algoritmo precisa de uma maneira de gerar uma string aleatória a partir do conjunto de genes.

In [14]:
def generate_parent(length):
    genes = []
    while len(genes) < length:
        sampleSize = min(length - len(genes), len(geneSet))
        genes.extend(random.sample(geneSet, sampleSize))
    return ''.join(genes)


(i) ***list.extend () acrescenta vários itens a uma lista. string.join () usa a string dada como um separador para criar uma nova string com os valores sendo unidos, por exemplo: 'x'.join ([' a ',' b ',' c ']) recebe "axbxc" .***

(i) ***random.sample () pega valores sampleSize da entrada sem substituição. Isso significa que não haverá duplicatas no pai gerado, a menos que o geneSet contenha duplicatas ou o tamanho seja maior que len (geneSet). A implementação acima pode gerar uma longa cadeia com um pequeno conjunto de genes e usa tantos genes únicos quanto possível.***

### Fitness

O valor de adequação que o algoritmo genético fornece é o único feedback que o mecanismo obtém para guiá-lo em direção a uma solução. Neste projeto, o valor de adequação é o número total de letras no palpite que correspondem à letra na mesma posição da senha.

In [15]:
def get_fitness(guess):
    return sum(1 for expected, actual in zip(target, guess) if expected == actual)

### Mutation

(i) ***zip () é uma função embutida que torna possível iterar duas listas (ou iterações) simultaneamente.***

Essa implementação usa uma substituição alternativa se o newGene selecionado aleatoriamente for o mesmo que ele deve substituir, o que pode impedir um número significativo de palpites desperdiçados. Em seguida, o mecanismo precisa de uma maneira de produzir um novo palpite, alterando o atual.

In [16]:
def mutate(parent):
    index = random.randrange(0, len(parent))
    childGenes = list(parent)
    newGene, alternate = random.sample(geneSet, 2)
    childGenes[index] = alternate if newGene == childGenes[index] else newGene
    return ''.join(childGenes)

Essa implementação converte a string pai em um array com list (parent), depois substitui 1 letra no array por um randomicamente selecionado de geneSet e finalmente recombina o resultado em uma string com .join (). Ele usa uma substituição alternativa se o newGene selecionado aleatoriamente for o mesmo que ele deve substituir, o que pode impedir um número significativo de palpites desperdiçados.

### Display

Em seguida, é importante monitorar o que está acontecendo para que o mecanismo possa ser parado se ficar preso. Ter uma representação visual da sequência do gene, que pode não ser a seqüência do gene literal, é freqüentemente crítica para identificar o que funciona e o que não funciona para que o algoritmo possa ser melhorado.

In [17]:
def display(guess):
    timeDiff = datetime.datetime.now() - startTime
    fitness = get_fitness(guess)
    print("{}\t{}\t{}".format(guess, fitness, timeDiff))

Normalmente, a função de exibição também gera o valor de adequação e quanto tempo se passou.

###  Main

O programa principal começa inicializando bestParent para uma seqüência aleatória de letras e chamando a função de exibição.

A peça final é o coração do motor genético. É um loop que:
1. gera um palpite
2. solicita a adequação para essa suposição, então
3. compara a adequação com a do melhor palpite anterior e
4. mantém o palpite com a melhor aptidão.

Este ciclo se repete até que ocorra uma condição de parada, neste caso, quando todas as letras no palpite coincidem com as do alvo.

In [18]:
random.seed()
startTime = datetime.datetime.now()
bestParent = generate_parent(len(target))
bestFitness = get_fitness(bestParent)
display(bestParent)

while True:
    child = mutate(bestParent)
    childFitness = get_fitness(child)
    if bestFitness >= childFitness:
        continue
    display(child)
    if childFitness >= len(bestParent):
        break
    bestFitness = childFitness
    bestParent = child

kpeQHjsJE.ub	0	0:00:00.001001
kpeQHjsoE.ub	1	0:00:00.003000
kpeQHjsoE.u!	2	0:00:00.003999
kpelHjsoE.u!	3	0:00:00.005000
kpelHjsor.u!	4	0:00:00.005997
HpelHjsor.u!	5	0:00:00.006996
HpelHjsorlu!	6	0:00:00.006996
HpelHjsorld!	7	0:00:00.008994
HpelH sorld!	8	0:00:00.013991
HpllH sorld!	9	0:00:00.018989
HellH sorld!	10	0:00:00.019988
HellH World!	11	0:00:00.040976
Hello World!	12	0:00:00.066962
