# CMMP (Cent mille milliards de poèmes)

This project aims at reproducing Raymond Queneau's book *Cent mille milliards de poèmes* in a digital format. At each execution, a poem is created randomly as if someone was manipulating the real book and turning randomly the 14 separate strips that compose it.

In [15]:
import re
import random

def extract_verses():
    f = open('cmmp.html')
    cmmp = f.read()
    ends = [m.start() for m in re.finditer('</SELECT>', cmmp)]
    starts = [m.end() for m in re.finditer('<SELECT NAME="vers[0-9]*">', cmmp)]
    verse_batches = [[] for _ in range(0, 14)]
    for k, (i, j) in enumerate(zip(starts, ends)):
        verse_batch = cmmp[i:j]
        starts_ = [m.end() for m in re.finditer('<OPTION>', verse_batch)]
        ends_ = [start-8 for start in starts_][1:]
        for i_, j_ in zip(starts_, ends_):
            verse_batches[k].append(verse_batch[i_:j_-1])
        verse_batches[k].append(verse_batch[starts_[-1]:-1])
    return verse_batches
            
def build_poem(verse_batches):
    verses = ''
    for verse_batch in verse_batches:
        verses += random.choice(verse_batch) + '\n'
    return verses

def correct_accents(verses):
    accent_to_code = {'À' : '&Agrave;' ,
               'à' : '&agrave;',
               'Â' : '&Acirc;',
               'â' : '&acirc;',
               'Ç' : '&Ccedil;',
               'ç' : '&ccedil;',
               'È' : '&Egrave;',
               'è' : '&egrave;',
               'É' : '&Eacute;',
               'é' : '&eacute;',
               'Ê' : '&Ecirc;',
               'ê' : '&ecirc;',
               'Ë' : '&Euml;',
               'ë' : '&euml;',
               'Î' : '&Icirc;',
               'î' : '&icirc;',
               'Ï' : '&Iuml;',
               'ï' : '&iuml;',
               'Ô' : '&Ocirc;',
               'ô' : '&ocirc;',
               'Œ' : '&OElig;',
               'œ' : '&oelig;',
               'Ù' : '&Ugrave;',
               'ù' : '&ugrave;',
               'Û' : '&Ucirc;',
               'û' : '&ucirc;',
               'Ü' : '&Uuml;',
               'ü' : '&uuml;',
               'Ÿ' : '&#376;',
               'ÿ' : '&yuml;'}
    code_to_accent = {code : accent for (accent, code) in accent_to_code.items()}
    for code in code_to_accent.keys():
        while code in verses:
            i = verses.find(code)
            verses = verses[:i] + code_to_accent[code] + verses[i+len(code):]
    return verses
        

verse_batches = extract_verses()
verses = build_poem(verse_batches)
verses = correct_accents(verses)

print(verses)

Le marbre pour l'acide est une friandise
se faire il pourrait bien que ce soit des jumeaux
il se penche et alors à sa grande surprise
et fermentent de même et les cuirs et les peaux
On vous fait devenir une orde marchandise
le vulgaire s'entête à vouloir des vers beaux
il grelottait le pauvre aux bords de la Tamise
la mite a grignoté tissu os et rideaux
Le généalogiste observe leur bouillotte
une langue suffit pour emplir sa cagnotte
le colonel s'éponge un blason dans la main
Cela considérant ô lecteur tu suffoques
on transporte et le marbre et débris et défroques
l'écu de vair ou d'or ne dure qu'un matin

