# Evaluation der Trainingskurven und der Ergebnisse auf dem Testset

Genau wie im Trainings-Notebook importieren wir zunächst einige Bibliotheken, die wir benutzen werden, richten unsere Umgebung ein und wählen die Graphikkarte, die wir für unsere Berechnungen benutzen.

In [None]:
# Und wir benutzen matplotlib zur graphischen 
# Darstellung der Lernkurven
import matplotlib.pyplot as plt 

# Diese Funktion liest die Logdateien ein, die wir 
from RNN_helper_functions import read_log_data

# Wir teilen matplotlib mit, dass die Kurven direkt hier ins Notebook gezeichnet werden sollen.
%matplotlib inline

### Trainingskurven
Zunächst schauen wir uns die Trainingskurven an. Falls z.B. die Learning-Rate zu groß ist und die Kostenfunktion explodiert, kann man das so sofort erkennen.

__Ohne eine Darstellung der Lernkurven, die zeigen, wie sich die Kostenfunktion auf dem Trainings- und Validierungsset während des Trainings entwickelt, sollte man keinem Deep-Learning-Ergebnis trauen.__

In [None]:
# Wir geben den Namen des Netzwerks ein, von dem wir uns die Trainingskurven anschauen wollen.
model_name = 'my_own_recipes'

# Jetzt lesen wir die Metriken, die wir in der Trainingsschleife nach jeder Epoche gespeichert haben
log_file = 'log' + model_name + '.txt'
log_data = read_log_data(log_file)

# Zuerst zeichnen wir eine Graphik, die die Lernkurven der Kostenfunktion ("loss") auf dem Trainings-
# und Validierungsset darstellt
plt.figure()
plt.title('Loss')
plt.plot(log_data['epoch'],log_data['train loss'],label="train loss")
plt.plot(log_data['epoch'],log_data['validation loss'],label="validation loss")
plt.xlabel('Epoche')
plt.ylabel('Kostenfunktion')
plt.legend(loc='best')
plt.show()

Man sollte hier sehen, dass die Zielfunktion sowohl auf den Trainingsdaten, als auch auf den Validierungsdaten zun ächstabnimmt.

Ab einem gewissen Punkt sollte das Validierungsloss ein Plateau erreichen oder sogar beginnen, wieder anzusteigen.
An diesem Punkt beginnt unser Netzwerk, nicht nur die grundlegende Struktur, sondern auch zufällige Rauschartefakte aus den Trainingsdaten zu lernen. Wie gesagt nutzen tiefe neuronale Netze einfach *alles* an Information, was der Trainingsdatensatz anbietet, aus, um die Zielfunktion auf diesem Trainingsdatensatz zu minimieren. Dies führt zum einen dazu, dass die Zielfunktion auf den Trainingsdaten noch weiter sinkt, indem diese im Extremfall einfach auswendig gelernt werden. Da sich solch zufälliges Rauschen in den Trainingsdaten sich jedoch nicht auf neue, ungesehene Daten übertragen lässt, nimmt die Fähigkeit unseres Netzwerks, auch neue, ungesehene Daten sinnvoll zu verarbeiten ab diesem Punkt ab. Man sagt das Netzwerk beginnt mit Overfitting auf den Trainingsdaten (s. Exkurs im Trainingsnotebook). D.h. dass man das Training an dem Punkt, an dem das Validation loss ein Plateau erreicht, beenden sollte.

Eine nette Urban Legend zu diesm Thema finden sie hier: https://www.gwern.net/docs/www/neil.fraser.name/e6cd471628867a9b75e6d82e0cc4894856398dd5.html

# Metriken auf dem Testset
Als nächstes schauen wir uns den Wert der Zielfunktion auf dem unabhängigen Testset an, das wir bereits im Trainings-Notebook vorbereitet und gespeichert haben.

In [None]:
from RNN_helper_functions import load_dataset_info, save_dataset_info

dataset_name, indices = load_dataset_info('dataset_' + model_name + '.txt')

# Wir geben den Dateinamen des gesamten Datensatzes aus
print(dataset_name)
# Und die Indices, die Trainings-, Validierungs- und Testdatensatz trennen
print(indices)

# Textgenerierung

Wir stellen in der Datei RNN_helper_functions eine Funktion zur Verfügung, um mit wenig Programmieraufwand Text mit ihrem trainierten Modell zu generieren.

In [None]:
from RNN_helper_functions import sample_from_rnn

sample_from_rnn(model_name = model_name, prompt = '''Recipe via''')

# Wie kann ich nun ein RNN einfach in mein eigenes Projekt einbinden?

Diese Funktion ist eine von drei Funktionen, die es ihnen ermöglichen soll, in ihren eigenen Projekten relativ einfach RNNs zu Trainieren, deren Training zu überwachen, und mit den trainierten Netzwerken Texte zu generieren. Für Details zur Benutzung betrachten sie bitte das Notebook **03_Easy_to_use_RNNs**.