# Textgenerierung mit LSTM und Embedding-Layer (Kafka/Goethe)

In [5]:
# Choose between 'Die Verwandulung' und 'Faust'
book = "goethe"  # Options: "kafka" or "goethe"

In [6]:
if book == "kafka":
    with open("verwandlung.txt", "r", encoding="utf-8") as file:
        contents = file.read()
    contents = "\n".join(contents.split("\n")[59:1952])
elif book == "goethe":
    with open("faust.txt", "r", encoding="utf-8") as file:
        contents = file.read()
    contents = contents.split("\n")[52:7052]
    contents = [line.strip() for line in contents]
    contents = "\n".join(contents)
    contents = contents.replace("\n", " \\n ")

## Laden des Mappings und Transformation der Tokens

In [7]:
import pickle
import nltk

nltk.download('punkt')

tokens = nltk.word_tokenize(contents)

with open("word_to_int.pickle", "rb") as file:
    word_to_int = pickle.load(file)
    
with open("int_to_word.pickle", "rb") as file:
    int_to_word = pickle.load(file)

tokens_transformed = [word_to_int[word] for word in tokens if word in word_to_int]

[nltk_data] Downloading package punkt to /Users/alex/nltk_data...
[nltk_data]   Package punkt is already up-to-date!


## Laden des trainierten Modells

In [8]:
from keras.models import load_model

if book == "kafka":
    model = load_model("verwandlung.keras")
    #model = load_model("verwandlung.model")
elif book == "goethe":
    model = load_model("faust.keras")
    #model = load_model("faust.model")


Ausgabe des Start-Satzes

In [9]:
sentence = tokens_transformed[100:140]

if book=='kafka':
    print(" ".join([int_to_word[token] for token in sentence]))
elif book=='goethe':
    print(" ".join([int_to_word[token] for token in sentence]).replace("\\n", "\n"))

Lebens Lauf , 
 Und nennt die , die , um schöne Stunden 
 Vom Glück , vor mir . 
 
 Sie hören nicht die , 
 Die , denen ich die ersten ; 
 ist das , 



## Prädiktion des nächsten Wortes in einem Text

In [10]:
import numpy as np

sentence = np.array(tokens_transformed[100:140])

for i in range(0, 300):
    prediction = model.predict(sentence.reshape(1, 40), verbose=0)
    
    # word = np.argmax(prediction[0])
    word = np.random.choice(len(int_to_word), p=prediction[0])
    print(int_to_word[word].replace("\\n", "\n"), end=" ")
    
    sentence = np.append(sentence[1:], [word])

Sie und schweben , 
 Und ich um all bin 
 Und sich mehr getan , 
 Um , was vor der ! 
 
 FAUST : 
 meinen hohe 
 
 FAUST : 
 will da doch lange , 
 hast ihr einen , 
 Die 's die Tag der . 
 
 FAUST : 
 Und , was , der Herr , die Mut , 
 Bin 's je , 
 Für gute . 
 
 MARTHE : 
 Laß ihr so fort ! '' 
 
 DER HERR : 
 
 MARGARETE : 
 Der Teufel her , ich gern die 
 Und besser vorbei auf , 
 all , 
 Als davon in meiner Brust zurück . 
 
 FAUST : 
 mehr ? 
 
 SCHÜLER : 
 Ihr sie die , 
 Nun , der , 
 Und hier gewiß vor diesem Stein . 
 Was wenn Ihr unten aufs haben getan , 
 Du mich nicht fehlt . 
 Doch gibt die ? 
 War das , in 
 Sich . 
 
 FROSCH : 
 er wird 's der , es mich ! 
 O mag es so ein Welt führen ! 
 Wir auf auch sein 
 Mein wird fehlt ein ; 
 So diese meiner , 
 Die Hand so , uns auf der Welt . 
 
 MARTHE ( von , am Garten läuft : 
 Gib fort , ist ! 
 Der ! armen ! 
 Weh , der sich meinen sehn . 
 
 MEPHISTOPHELES : 
 es frisch ! ich recht , `` doch ihr meinen mir , 
 Und von der