In [None]:
from tqdm import tqdm_notebook as tqdm 
import requests
import math
import os
import zipfile

files = {
    "trump.model": "https://downloads.codingcoursestv.eu/037%20-%20neuronale%20netze/trump.model",
}

for local, remote in files.items():
    if not os.path.exists(local):
        # Streaming, so we can iterate over the response.
        r = requests.get(remote, stream=True)

        # Total size in bytes.
        total_size = int(r.headers.get('content-length', 0));

        print("Downloading " + str(total_size / 1024 / 1024) + " MB.")

        block_size = 1024
        with open(local, 'wb') as f:
            for data in tqdm(r.iter_content(block_size), total=math.ceil(total_size//block_size), unit='KB', unit_divisor=1024, unit_scale=True):
                f.write(data)
    
    print("Done: " + local)

Downloading 106.77016830444336 MB.


HBox(children=(IntProgress(value=0, max=109332), HTML(value='')))

In [2]:
# Quelle: https://github.com/ryanmcdermott/trump-speeches/blob/master/speeches.txt

with open("speeches.txt", "r", encoding="utf-8") as file:
    contents = file.read()
    
contents = contents.split("\n")
contents = [line.strip() for line in contents if "SPEECH" not in line]

contents = "\n".join(contents)

In [3]:
# http://www.nltk.org/

import nltk
from nltk import word_tokenize
from sklearn.feature_extraction.text import CountVectorizer

nltk.download('punkt')

tokens = word_tokenize(contents)

cv = CountVectorizer(max_features=len(set(tokens)), lowercase=False, token_pattern="(.*)")
cv.fit(tokens)

features = cv.get_feature_names()

word_to_int = {}
int_to_word = {}

for i in range(0, len(features)):
    word = features[i]
    
    word_to_int[word] = i
    int_to_word[i] = word

[nltk_data] Downloading package punkt to /Users/jannis/nltk_data...
[nltk_data]   Package punkt is already up-to-date!


In [2]:
import pickle

with open("word_to_int.faust.pickle", "rb") as file:
    word_to_int = pickle.load(file)
    
with open("int_to_word.faust.pickle", "rb") as file:
    int_to_word = pickle.load(file)

In [3]:
tokens_transformed = [word_to_int[word] for word in tokens if word in word_to_int]

In [4]:
from keras.models import load_model

model = load_model("trump.model")

  from ._conv import register_converters as _register_converters
Using TensorFlow backend.


OSError: Unable to open file (unable to open file: name = 'trump.model', errno = 2, error message = 'No such file or directory', flags = 0, o_flags = 0)

In [6]:
sentence = tokens_transformed[100:140]

print(" ".join([int_to_word[token] for token in sentence]).replace("\\n", "\n"))

; 
 Gleich einer alten , halbverklungnen Sage 
 Kommt erste Lieb und Freundschaft mit herauf ; 
 Der Schmerz wird neu , es wiederholt die Klage 
 Des Lebens labyrinthisch irren Lauf , 
 Und nennt die Guten ,


In [8]:
import numpy as np

sentence = np.array(tokens_transformed[100:140])

for i in range(0, 300):
    prediction = model.predict(sentence.reshape(1, 40))
    
    # word = np.argmax(prediction[0])
    word = np.random.choice(len(int_to_word), p=prediction[0])
    print(int_to_word[word].replace("\\n", "\n"), end=" ")
    
    sentence = np.append(sentence[1:], [word])

die Bitte , Saat 
 Dreht ab im Pest voraus . 
 
 MARTHE : 
 Ei , ich gehn von dir zu geht ; 
 Er ich mit Gedanken , denn grade auf , 
 Und dem ist ein liebenswürdig Ziel 
 
 Durch 's am Götterhöhe da und Euch im Busen sagen . Die Ritze in der Herzen , 
 Die Engel dich nur aus der Munde . 
 
 FAUST : 
 Entfliehe , welche Dämmerschein , ) 
 
 DICHTER : 
 Es hat kein Herrn , nicht Schädel der Meister steigt . 
 Kannst du dich schmeichelnd allen Fehler werden , 
 Des Menschen spürt , im Gesellen reicht , 
 Nach der Gesellen , das sich so mich nicht treiben , 
 Den du grau diesen Kopf von deinem Meer , 
 Dort geb ich in deinem wünsche Weise , 
 Und in die Mann sich täglich Neuen ; 
 Sie Alter Brust der Leben zum besten meiden . 
 ( Sie wirst , dem solche Sinne auf der Blätter zurücktritt , indem er vor der Dingen stürzte . ) 
 
 FAUST : 
 Er käme mich , wo 's derweil ihn auf den Riegel Fegefeuer . 
 
 WAGNER : 
 Ich bitt dich , dazu kochen Jahr , 
 Daß das hier als was gelüsten . 
 
 FROSCH

In [None]:
len(int_to_word)

In [None]:
len(prediction[0])