# Text Generation

Zum Abschluss des Kurses schaust du dir jetzt noch an, wie ein Algorithmus Texte selbst erzeugen kann. Das ist ziemlich überraschend, allerdings sind die Anwendungsmöglichkeiten im Vergleich zu der Textanalyse etwas eingeschränkt. Ab und zu ergeben jedoch auch ziemlich lustige Resultate und vielleicht hast du ja genau dafür einen Anwendungsfall!

## Text Generation

Auch wenn ein riesiges Modell hinter der Texterzeugung steht, ist der Aufruf geradezu grotesk einfach:

In [None]:
!pip install transformers

In [None]:
from transformers import pipeline

model_name = "dbmdz/german-gpt2"
#model_name = "dbmdz/german-gpt2-faust"
pipe = pipeline('text-generation', model=model_name,
                 tokenizer=model_name, device=0)

Ähnlich wie bei BERT gibt es auch bei diesem Transfer-Learning sehr viele Zufallszahlengeneratoren, die du wegen der Reproduzierbarkeit der Ergebnisse alle einheitlich initialisierst:

In [None]:
import random
import numpy as np
import torch
# alle Zufallszahlengeneratoren initialisieren (Reproduzierbarkeit)
seed_val = 42
random.seed(seed_val)
np.random.seed(seed_val)
torch.manual_seed(seed_val)
torch.cuda.manual_seed_all(seed_val)

Du beginnst mit einem *sehr offenen Satz*:

In [None]:
text = pipe("Der Sinn des Lebens ist es", max_length=100)[0]["generated_text"]

print(text)

Der Text ist vielleicht nicht extrem sinnvoll, aber er hat die *Stimmung* des Anfangssatzes aufgenommen. Sehr interessant.

Versuche es nun mit einem Satz, der *Spannung auslösen soll*:

In [None]:
text = pipe("Plötzlich wachte ich auf", max_length=400)[0]["generated_text"]

print(text)

Auch dieses Ergebnis ist *mindestens interessant*. Der Text ist etwas unzusammenhängend und man hat das Gefühl, dass das Modell einige Wörter dann plötzlich so gut findet, dass es sie ständig wiederholt. Andererseits werden bestimmte Assoziationen (Nacht, schlafen usw.) doch ganz gut aufgenommen.

Schließlich kannst du noch *einen technischen Text* ausprobieren:

In [None]:
text = pipe("Ich experimentiere gerade mit automatischer Text-Erzeugung", max_length=100)[0]["generated_text"]

print(text)

Auch hier wurde die Richtung des Textes sehr gut aufgenommen und da System hat versucht, einen Text mit Fachbegriffen zu schreiben. Wie sinnvoll die tatsächlich sind, sei dahingestellt.

# Text Generation steht noch am Anfang

Die Beispiele haben eher lustige als tatsächlich verwendbare Text produziert.

Allerdings steht mit GPT-3 ein wesentlich leistungsfähigeres System zur Verfügung, mit dem schon viel bessere Resultate generiert werden können. Neue Resultate ermöglichen es außerdem, aus Texten Bilder zu erstellen, was auch schon zu guten (und teils überraschenden) Ergebnissen führt.

Auf jeden Fall lohnt es sich, wenn du solche Technologien weiter beobachtest.