# N-Order random text generation

In [1]:
import random

## Zero-Order text generation

Pure random choice. Every character is choosen by the same probabilty. No text is used as a base.

### Create vocabulary

In [2]:
''' Create a list of all characters between A and Z. '''
vocab = [chr(c) for c in range(ord('A'), ord('Z') + 1)]
print(vocab)

['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z']


In [3]:
''' Append punctuation and a space. '''
for punct in [',', '.', '!', '?', ' ']:
    vocab.append(punct)

print(vocab)

['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', ',', '.', '!', '?', ' ']


In [4]:
len(vocab)

31

### Pick a random symbol from the vocabulary

In [5]:
index = random.randint(0, len(vocab) -1)
print(index)
vocab[index]

4


'E'

### Generate zero-order random text

In [7]:
generated_text = '' # Variable to store our generated text.

for i in range(60):
    # Get a random index.
    index = random.randint(0, len(vocab) - 1)
    
    # Get the corresponding symbol.
    symbol = vocab[index]
    
    # Append it to our generated text.
    generated_text += symbol

# Print the generated text after the loop has ended.
print(generated_text)

LYETKWS.BVK!!EAYL AGNQ,W OZOB,APSFXM?WZTXCUSM.TCUP.FTOVGUHYN


## First-Order text generation

Probabilities are drawn from a text analysis. Characters that appear more often in the text will have a higher probability to be chosen.

In [9]:
''' Example. '''

txt = 'aaabaa'

''' The easiest method is to simply store all characters in a list.
Characters that appear often in the text are more often stored in the list
and thus picked more often. '''

characters = [c for c in txt]
print('characters:', characters, '\n')

for i in range(20):
    print(random.choice(characters), end=' ')

characters: ['a', 'a', 'a', 'b', 'a', 'a'] 

a a a a a a b a a a a a a a a a a a a a 

In [10]:
''' Frisch, Max. Schwarzes Quadrat. Zwei Poetikvorlesungen. Frankfurt am Main: Suhrkamp, 2008. 73-74. '''

txt = '''
– Die POESIE ist zweckfrei.
(Schon das macht sie zur Irritation.)

– Die POESIE muss kein Kabinett bilden, zum Beispiel, und muss nicht von einer analphabetischen Mehrheit gewählt werden.

– Die POESIE ist da oder manchmal auch nicht.
(Regierungen sind immer da.)

– Die POESIE kann ignoriert werden.
(Ohne dass die Polizei deswegen eingreift.)

– Die POESIE entsteht trotzdem da und dort.

– Die POESIE ist der Durchbruch zur genuinen Erfahrung unsrer menschlichen Existenz in ihrer geschichtlichen Bedingtheit. Sie befreit uns zur Spontaneität – was beides sein kann: Glück oder Schrecken.
(Regierungen wollen immer nur unser Glück.)

– Die POESIE macht uns betroffen.
(Lebendig.)

– Die POESIE unterwandert unser ideologisiertes Bewusstsein und insofoern ist sie subversiv in jedem gesellschaftlichen System.
(Platon hat natürlich recht: der Poet ist als Staatsbürger dubios, auch wenn er seine Steuern zahlt, auch wenn er als Soldat gehorcht, damit er nicht von seinen eignen Leuten erschossen wird; solange er aber nicht erschossen ist, bleibt er ein Poet.)

– Die POESIE muss keine Massnahmen ergreifen.
(Sie muss nur Poesie sein.)

– Die POESIE findet sich nicht ab (im Gegensatz zur Politik) mit dem Machbaren; sie kann nicht lassen von der Trauer, dass das Menschsein auf dieser Erde nicht anders ist.

– Die POESIE sagt nicht, wohin mit dem Atom-Müll.
(Rezepte sind von ihr nicht zu erwarten.)

– Die POESIE ist arrogant.
(Sie entzieht sich der Pflicht, die Welt zu regieren.)

– Die POESIE ist unbrauchbar.
(Es genügt ihr, dass sie da ist: als Ausdruck unseres profunden Ungenügens und unsrer profunden Sehnsucht.)

– Die POESIE wahrt die Utopie.
'''
print(txt[:200])


– Die POESIE ist zweckfrei.
(Schon das macht sie zur Irritation.)

– Die POESIE muss kein Kabinett bilden, zum Beispiel, und muss nicht von einer analphabetischen Mehrheit gewählt werden.

– Die POES


### Generate first-order random text

In [12]:
characters = [c for c in txt]

for i in range(50):
    print(random.choice(characters), end='')

e  otnrt s  ng ermD  ineriuc
eE tgi ncsd ennu. mt 

## Second-Order text generation

The probability of a character is drawn from its left neighbor. 

### Create vocabulary

In [9]:
''' Create a vocabulary.
Store for each character all characters that are next to it in a dictionary.'''

vocabulary = {}

for i in range(len(txt) -1):
    key = txt[i]
    value = txt[i+1]
    # check if key exists
    if key in vocabulary.keys():
        # append value
        vocabulary[key].append(value)
    # else insert new key + value
    else:
        vocabulary[key] = [value]

In [10]:
''' Print all options for one character. '''
vocabulary['P']

['O',
 'O',
 'O',
 'O',
 'o',
 'O',
 'O',
 'O',
 'O',
 'l',
 'o',
 'o',
 'O',
 'o',
 'O',
 'o',
 'O',
 'O',
 'f',
 'O',
 'O']

In [11]:
''' Return a randomly selected character from our list of options. '''

def next_token(input_):
    # Get all options stored for one character.
    options = vocabulary[input_]
    # Pick one.
    choice = random.choice(options)
    # Return this value.
    return choice

print(next_token('P'))

o


### Generate second-order random text

In [12]:
''' Generate text. '''

generated_text = '– Die POESIE' # We start with this as input.

# The code below is executed 50 times to append 50 characters.
for i in range(50):
    # We insert the last character of generated_text as input
    # and append the one returned value to the generated_text.
    generated_text += next_token(generated_text[-1])
    
print(generated_text)

– Die POESIESIESoroenginihrt z Lenn Mamer ier m-Müchrusollldie


## Third-Order text generation

In [13]:
''' Create a vocabulary.
Store for each character all characters that are next to it.'''

n = 2
vocabulary = {}

for i in range(len(txt) -n):
    key = txt[i:i+n]
    value = txt[i+n]
    # check if key exists
    if key in vocabulary.keys():
        # append value
        vocabulary[key].append(value)
    # else insert new key + value
    else:
        vocabulary[key] = [value]

In [14]:
''' Print all options for n characters. '''
vocabulary['PO']

['E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E', 'E']

In [15]:
''' Return a randomly selected character from our list of options. '''

def next_token(key):
    # check if token is included in the vocabulary
    if not key in vocabulary.keys():
        # pick a random key
        key = random.choice(list(vocabulary.keys()))
    # get options
    options = vocabulary[key]
    # return a random choice
    return random.choice(options)

In [16]:
print(next_token('PO'))

E


### Generate third-order random text

In [17]:
''' Generate text. '''

generated_text = '– Die POESIE'

for i in range(50):
    generated_text += next_token(generated_text[-n:])
    
print(generated_text)

– Die POESIE mität las gehr, dubver auchbart.
(Plat angen.

– 


## N-Order text generation

(This is similar to the code above, but reduced to the necessary code.)

In [18]:
''' Create a vocabulary.
Store for each character all characters that are next to it.'''

n = 5
vocabulary = {}

for i in range(len(txt) -n):
    key = txt[i:i+n]
    value = txt[i+n]
    # check if key exists
    if key in vocabulary.keys():
        # append value
        vocabulary[key].append(value)
    # else insert new key + value
    else:
        vocabulary[key] = [value]
        
''' Return a randomly selected character from our list of options. '''

def next_token(key):
    # check if token is included in the vocabulary
    if not key in vocabulary.keys():
        # pick a random key
        key = random.choice(list(vocabulary.keys()))
    # get options
    options = vocabulary[key]
    # return a random choice
    return random.choice(options)

### Generate n-order random text

In [20]:
''' Generate text. '''

generated_text = '– Die POESIE'

for i in range(200):
    generated_text += next_token(generated_text[-n:])
    
print(generated_text)

– Die POESIE ist unbrauchbaren; sie zur Spontaneität – was beides seine Steuern zahlt, auch wenn er aber nicht zu regierungen sind immer nur Poet.)

– Die POESIE ist zweckfrei.
(Schon das Menschlichen Bedingtheit
