# Transformer-basierter Smalltalk-Chatbot
### Kleiner Vorgeschmack auf Transformer

Die sogenannte "Transformer"-Architektur stellt den State-of-the-Art in der Sprachverarbeitung dar. Wir werden uns im nächsten Workshop (8.5.) detailliert mit der Funktionsweise und dem Training dieser Klasse von neuronalen Netzen beschäftigen.

Für heute wollen wir es jedoch dabei belassen, dass diese Netzwerke in der Lage sind, relativ komplexe und lange Texte zu verarbeiten und dabei auch Zusammenhänge zwischen weit voneinander entfernten Worten oder Textabschnitten im Auge zu behalten (mittels eines so genannten "Attention" (Aufmerksamkeits-) Mechanismus).

Obwohl (oder vielleicht gerade da) die Transformer-Architektur eine der komplexeren Netzwerkstrukturen ist, gibt es eine sehr aktive und offene Community, die nicht nur entsprechende Publikationen, sondern auch die Netzwerkarchitekturen, Datensätze und sogar die fertig trainierte Netzwerke frei zur Verfügung stellt, z.B. über das Huggingface "transformers" Repository (https://github.com/huggingface/transformers). Im Folgenden werden wir aus diesem Repository ("from transformers") das "pipeline" Modul laden, welches für viele Aufgaben des Natural Language Processing schon vorgefertigte Pipelines (inclusive trainierter Transformernetzwerke) zur Verfügung stellt. Außerdem importieren wir die Klasse "Conversation", die es erlaubt, den Verlauf einer Conversation zu speichern und direkt an diese Transformernetzwerke zu übergeben.

In [None]:
from transformers import pipeline, Conversation

Als nächstes erzeugen wir eine "conversational" Pipeline, die eine Chatbot-Konversation mit Hilfe eines votrainierten Transformernetzwerkes implementiert. Die vortrainierten Netzwerke, die zur Auswahl stehen, sind drei Versionen von DialogGPT, die sich im wesentlichen in ihrer Größe (d.h. der Anzahl der trainierten Netzwerkgewichte/Parameter) unterscheiden.
Hier sind die drei "Model cards" dieser Modelle in dem Huggingface repository: 

- https://huggingface.co/microsoft/DialoGPT-small
- https://huggingface.co/microsoft/DialoGPT-medium
- https://huggingface.co/microsoft/DialoGPT-large

In der nächsten Zelle erzeugen wir die entsprechende Pipeline, wobei der model = parameter bestimmt, welches Modell die Pipeline benutzen soll ('microsoft/DialoGPT-small', 'microsoft/DialoGPT-medium' oder 'microsoft/DialoGPT-large'). Beachten sie, dass alle diese Modelle auf einem großen Textkorpus von **englischen** Reddit-Konversationen trainiert wurden.

In [None]:
conversational_pipeline = pipeline("conversational", model = 'microsoft/DialoGPT-large')

Um eine Konversation mit Hilfe dieser Pipeline zu führen, benutzen wir eine "Conversation"-Struktur, die wir "conversation1" nennen. Diese behält den Überblick über die Benutzer-Inputs und die Bot-Antworten, d.h. über den gesamten Verlauf des Gespräches. Jede Konversation startet mit einem Nutzer-Input. Diesen speichern wir in der Variablen "conversation_start" und übergeben ihn "Conversation", um die entsprechende Struktur zu initialisieren.

In [None]:
conversation_start = "Let's watch a movie tonight - any recommendations?"

# Erstelle eine "Conversation"-Struktur, die mit dem User-Input initialisiert wird,
# der in "conversation_start" gespeichert ist
conversation1 = Conversation(conversation_start)

"conversation1" hilft uns nun dabei, den Überblick über den Verlauf unserer Unterhaltung zu behalten. Man kann jederzeit die gesamte bisherige Unterhaltung ausgeben mittels des folgenden Befehls:

In [None]:
print(conversation1)

Jede Instanz von "Conversation" (z.B. "conversation1") erhält eine eigene "id". Das erlaubt es der Conversational-Pipeline auch mehrere Conversations gleichzeitig zu bearbeiten. Wir bleiben aber zunächst bei einer einzelnen Konversation. Wir können nun unserer "conversational_pipeline" die entsprechende Konversation übergeben. Dann generiert das Transformer-Modell aus dem bisherigen Chatverlauf die nächste Antwort des Bots.

In [None]:
conversation1 = conversational_pipeline(conversation1)

Der obige Befehl aktualisiert "conversation1", in dem er eine entsprechende Botantwort hinzufügt. Schauen wir uns den neuen Zustand unserer Konversation an:

In [None]:
print(conversation1)

Um die Konversation fortzuführen, fügen wir einen weitern User-Input hinzu. Das geht mittels conversaton1.add_user_input(...).

In [None]:
next_user_input = "Did you like that movie?"
conversation1.add_user_input(next_user_input)

print(conversation1)

Jetzt können wir wieder conversational_pipeline nutzen, um die nächste Antwort zu generieren.

In [None]:
conversation1 = conversational_pipeline(conversation1)

print(conversation1)

Wir wollen nicht immer auf die ganze Konversation zugreifen, sondern z.B. nur auf einzelne User-Inputs oder Chatbot-Outputs. Dies können wir über die entsprechenden Listen conversation1.past_user_inputs bzw. conversation1.generated_responses tun. Schauen wir uns zunächst die conversation1.past_user_inputs Liste an.

In [None]:
print(conversation1.past_user_inputs) # Ganze Liste

In [None]:
print(conversation1.past_user_inputs[0]) # Erster Eintrag

In [None]:
print(conversation1.past_user_inputs[1]) # Zweiter Eintrag

In [None]:
print(conversation1.past_user_inputs[-1]) # Letzter Eintrag

Als nächstes schauen wir uns conversation1.generated_responses an.

In [None]:
print(conversation1.generated_responses) # Ganze Liste

In [None]:
print(conversation1.generated_responses[0]) # Erster Eintrag

In [None]:
print(conversation1.generated_responses[1]) # Zweiter Eintrag

In [None]:
print(conversation1.generated_responses[-1]) # Letzter Eintrag

## Kleines Projekt 
Können sie mit Hilfe der oben vorgeführten Transformers Conversational-Pipeline einen interaktiven Chatbot bauen, der sich an der Struktur unserer ersten Chatbot-Übung orientiert? Eine mögliche Lösung können sie durch Klick auf den Text ganz unten aufklappen.

In [None]:
from transformers import pipeline, Conversation

print("Willkommen beim Chatbot")
print("Worüber würden Sie gerne heute sprechen?")
print("Zum beenden einfach 'bye' eintippen")
print("")

##### Hier kommt ihr Code (starten sie auch gerne mit ihrer Lösung der ersten
##### Chatbot-Aufgabe)

<details><summary>**Klicken sie hier für eine mögliche Lösung**</summary>
<p>

```python

from transformers import pipeline, Conversation

print("Wellcome to the Chat")
print("What would you like to talk about?")
print("Enter 'bye' to quit.")
print("")

conversational_pipeline = pipeline("conversational")

nutzereingabe = ""
conv = Conversation()

while nutzereingabe != "bye":
    
    nutzereingabe = input("Ihre Frage/Antwort: ")
    
    conv.add_user_input(nutzereingabe)
    
    res = conversational_pipeline(conv)
    
    print(res.generated_responses[-1])

```

</p>
</details>