In [1]:
import numpy as np
np.random.seed(1234)

In [2]:
from IPython.core.debugger import set_trace

In [38]:
target_phrase = np.array(list("et tu brute?".lower()))
target_len = len(target_phrase)

In [39]:
import string

In [52]:
vocab = np.array(list(set(string.ascii_lowercase).union(set(target_phrase))))

In [53]:
vocab

array(['a', 'c', 'b', 'e', 'd', 'g', 'f', 'i', 'h', 'k', 'j', 'm', 'l',
       'o', 'n', 'q', 'p', 's', 'r', 'u', 't', 'w', 'v', 'y', 'x', 'z',
       '?'], dtype='|S1')

In [54]:
POP_SIZE = 500
MUTATION_RATE = 0.005

In [55]:
class Organism:
    def __init__(self, dna=None):
        if dna is None:
            self.dna = np.random.choice(vocab, target_len, replace=True)
        else:
            self.dna = dna
        self.name = "".join(self.dna)
        self.size = len(self.dna)
        self.mid = self.size // 2
    
    def fitness(self):
        return np.mean(self.dna == target_phrase)

In [56]:
def create_population(n=POP_SIZE):
    return [Organism() for _ in range(n)]

In [57]:
def create_pool(org_list):
    num = len(org_list)
    scores = np.array([o.fitness() for o in org_list])
    proba = scores / np.sum(scores)
    return np.random.choice(org_list, num, p=proba)

In [58]:
def natural_selection(org_list):
    num = len(org_list)
    next_gen = []
    for _ in range(num):
        a, b = np.random.choice(org_list, 2, replace=False)
        child = crossover(a, b)
        child = mutate(child)
        next_gen.append(child)
        
    return next_gen

In [59]:
def crossover(a, b):
    mid = a.mid
    dna = np.hstack((a.dna[:mid], b.dna[mid:]))
    return Organism(dna)

In [60]:
def mutate(org):
    new_dna = []
    for gene in org.dna:
        if np.random.rand() < MUTATION_RATE:
            ## mutate
            new_dna.append(np.random.choice(vocab))
        else:
            new_dna.append(gene)
    return Organism(np.array(new_dna))

In [61]:
def get_best(org_list):
    cur_best = -1
    for o in org_list:
        score = o.fitness()
        if score>cur_best:
            best = o
            cur_best = score
            
    return best

In [62]:
def main():
    found = False
    generation = 0
    population = create_population()
    
    while not found:
        generation += 1
        best_org = get_best(population)
        if np.alltrue(best_org.dna == target_phrase):
            found = True
            break
        
        if generation%100==0:
            print "Generation: %d, Best organism: %s, Fitness: %f"%(generation, best_org.name, best_org.fitness())
            
        population = natural_selection(population)
    
    print "FOUND"
    print "Generation: %d, Best organism: %s, Fitness: %f"%(generation, best_org.name, best_org.fitness()) 

In [63]:
main()

Generation: 100, Best organism: jytxsniiag, Fitness: 0.100000
Generation: 200, Best organism: uytxsxmpx?, Fitness: 0.200000
Generation: 300, Best organism: cqlugpbpx?, Fitness: 0.200000
Generation: 400, Best organism: wptegvctfe, Fitness: 0.200000
Generation: 500, Best organism: bflvw?ctfk, Fitness: 0.100000


KeyboardInterrupt: 

In [17]:
population = create_population(25)

In [18]:
for org in population:
    print org.name, org.fitness()

r?tuu bbbe?r 0.25
?uue?e  ut b 0.16666666666666666
??e rute?err 0.0
 br rerubrrr 0.0
eb?ruer?ubtu 0.25
 uttbtbubut  0.16666666666666666
b  u? ?uerbe 0.16666666666666666
t?ett?urt??u 0.16666666666666666
?eeuuebr?eb? 0.3333333333333333
ub bebebebbt 0.08333333333333333
ubeu tubebb? 0.08333333333333333
r?utbtre uru 0.08333333333333333
 ? u ub ?b e 0.16666666666666666
 reer?ebu bb 0.08333333333333333
eetureuttb   0.08333333333333333
tru  tb ?rbb 0.08333333333333333
?brrbruutubr 0.0
?tb??eb  uu  0.16666666666666666
 btt?trbubre 0.16666666666666666
rtee? ?bbrru 0.16666666666666666
reuebre bbr? 0.08333333333333333
uruerbt t  b 0.0
e?rburb tbue 0.25
rbebur ??tut 0.16666666666666666
ru   ?bru? b 0.3333333333333333


In [19]:
pool = create_pool(population)
for org in pool:
    print org.name, org.fitness()

?eeuuebr?eb? 0.3333333333333333
r?tuu bbbe?r 0.25
?eeuuebr?eb? 0.3333333333333333
 uttbtbubut  0.16666666666666666
 ? u ub ?b e 0.16666666666666666
reuebre bbr? 0.08333333333333333
 ? u ub ?b e 0.16666666666666666
 ? u ub ?b e 0.16666666666666666
r?tuu bbbe?r 0.25
?eeuuebr?eb? 0.3333333333333333
 btt?trbubre 0.16666666666666666
ru   ?bru? b 0.3333333333333333
 reer?ebu bb 0.08333333333333333
t?ett?urt??u 0.16666666666666666
?tb??eb  uu  0.16666666666666666
ru   ?bru? b 0.3333333333333333
 uttbtbubut  0.16666666666666666
ru   ?bru? b 0.3333333333333333
 ? u ub ?b e 0.16666666666666666
rtee? ?bbrru 0.16666666666666666
 ? u ub ?b e 0.16666666666666666
eetureuttb   0.08333333333333333
?eeuuebr?eb? 0.3333333333333333
?uue?e  ut b 0.16666666666666666
 ? u ub ?b e 0.16666666666666666


In [20]:
child = crossover(pool[-1], pool[-2])

In [21]:
child.name, child.fitness()

(' ? u u  ut b', 0.25)

In [22]:
best = get_best(population)
best.name, best.fitness()

('?eeuuebr?eb?', 0.3333333333333333)

In [118]:
org = population[-2]

In [119]:
new_org = mutate(org)

In [120]:
new_org.name

'zjtwchsiotu?'