# Jupyter Notebook f√ºr den Studienfonds üí°

## Struktur

Dieses Jupyter-Notebook enth√§lt vier Codezellen.
Die erste Codezelle definiert Funktionen, die du w√§hrend des gesamten Workshops verwenden kannst. Du kannst sie nach Belieben √§ndern, aber aus Gr√ºnden der Einfachheit empfehle ich dir, diese Funktionen so zu belassen, wie sie sind.

Die zweite Codezelle enth√§lt die Trainingslogik. W√§hrend dieses Workshops wirst du viele neuronale Netzwerke mit unterschiedlichen Architekturen trainieren. Du kannst diese Zelle einfach in eine neue Zelle kopieren und jede Vorkommen von model_1 in dieser Zelle durch model_2 ersetzen, dann im n√§chsten Modell durch model_3 usw.

Die dritte Codezelle enth√§lt die Logik zur Bewertung des Modells und liefert dir alle ben√∂tigten Evaluationsmetriken. Dazu geh√∂ren die geplottete Verlaufskurve, wie in der Pr√§sentation gezeigt, sowie zwei Konfusionsmatrizen ‚Äì eine f√ºr die Trainingsdaten und eine f√ºr die Testdaten. Auch diese Zelle kannst du kopieren und unter dein Modell einf√ºgen.

Die vierte Codezelle enth√§lt die Logik zum Plotten zuf√§lliger Bilder mit ihren wahren und vorhergesagten Labels. Sie kann mehrfach f√ºr ein einzelnes Modell ausgef√ºhrt werden, sodass du m√∂glicherweise erkennen kannst, warum Bilder mit anderen Labels verwechselt werden. Kopiere auch diese Codezelle in das Modell, f√ºr das du sie verwenden m√∂chtest.

In [None]:
import tensorflow as tf
from tensorflow.keras.datasets import fashion_mnist
import itertools
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay
import random
import matplotlib.pyplot as plt

# Laden der Trainingsdaten

(train_data, train_labels), (test_data, test_labels) = fashion_mnist.load_data()
class_names = ["T-shirt/top","Trousers","Pullover","Dress","Coat","Sandal","Shirt","Sneaker","Bag","Ankle boot"]

# Hilfsfunktionen, welche benutzt werden sollen:


def plot_random_images():
  plt.figure(figsize=(7,7))
  for i in range(4):
    ax = plt.subplot(2, 2, i+1)
    rand_index = random.choice(range(len(train_data)))
    plt.imshow(train_data[rand_index], cmap=plt.cm.binary)
    plt.title(class_names[train_labels[rand_index]])
    plt.axis(False)
  return

import pandas as pd

def plot_history(history, plot_title):
  pd.DataFrame(history.history).plot(title=plot_title)

def plot_confusion_matrix(y_true, y_pred, labels, train_test_label,  modelname, figsize=(10,10)):
  cm = confusion_matrix(y_true, y_pred)
  cm_plot = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=labels)
  fig, ax = plt.subplots(figsize=figsize)
  plt.title("Confusion matrix of " + train_test_label + ", Model-Name: " + modelname)
  cm_plot.plot(ax=ax)
  plt.xticks(rotation=90)
  plt.yticks(rotation=0)
  plt.show()
  return

def make_predictions(model, data):
  y_probs = model.predict(data)
  y_pred = tf.argmax(y_probs, axis=1)
  return y_pred

def evaluate_model_full(model, train_data, train_labels, test_data, test_labels, history, modelname):
  print(f"Evaluating Model {modelname}")

  train_loss, train_acc = model.evaluate(train_data, train_labels)
  test_loss, test_acc = model.evaluate(test_data, test_labels)
  print(f"Train loss: {train_loss}\nTrain accuracy: {train_acc}\nTest loss: {test_loss}\nTest accuracy: {test_acc}")

  plot_history(history, f"History of Training {modelname}")

  y_pred_test = make_predictions(model, test_data)
  y_pred_train = make_predictions(model, train_data)

  plot_confusion_matrix(test_labels, y_pred_test, class_names, "Test-Data", modelname)
  plot_confusion_matrix(train_labels, y_pred_train, class_names, "Train-Data", modelname)
  return

def plot_random_image_with_predictions(images, predicted_labels, true_labels, class_names):
  i = random.randint(0, min(len(images), len(predicted_labels)) - 1)

  target_image = images[i]
  predicted_label = predicted_labels[i]
  true_label = true_labels[i]

  predicted_label = class_names[predicted_label]
  true_label = class_names[true_label]

  plt.figure()
  plt.imshow(target_image, cmap=plt.cm.binary)

  if predicted_label == true_label:
    color = "green"
  else:
    color = "red"

  plt.title(f"Predicted: {predicted_label}\nTrue: {true_label}", color=color)
  plt.axis(False)
  return

**Ideen zur Verbesserung der Modellleistung:**

- Hinzuf√ºgen von Bild-Normalisierungsschichten (1.0 / 255.0)
- Hinzuf√ºgen weiterer Schichten
- Erh√∂hen der Anzahl der Neuronen in den Schichten
- Dropout-Schichten verwenden
- Erh√∂hen der Anzahl der Epochen
- Verschiedene Optimierer ausprobieren
- Lernrate erh√∂hen/verringern
...

In [None]:
# Zelle mit deinem Modell: Kopiere diese Zelle, passe dein Modell an und vergiss nicht, deine Variablennamen umzubenennen. :)

model_1 = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28,28)),
    tf.keras.layers.Dense(4, activation="relu"),
    tf.keras.layers.Dense(4, activation="relu"),
    tf.keras.layers.Dense(len(class_names), activation="softmax")
])

model_1.compile(
    loss=tf.keras.losses.SparseCategoricalCrossentropy(),
    optimizer=tf.keras.optimizers.Adam(learning_rate=0.001),
    metrics=["accuracy"]
)

model_1_history = model_1.fit(train_data, train_labels, epochs=20, validation_data=(test_data,test_labels))

In [None]:
# Rufe diese Funktion auf, um alle erforderlichen Modellmetriken zu erhalten. Kopiere sie unter deinen Modellcode.
evaluate_model_full(model_1, train_data, train_labels, test_data, test_labels, model_1_history, "model_1")

In [None]:
# Plotte zuf√§llige Bilder => Die Zelle kann mehrfach ausgef√ºhrt werden. Kopiere sie unter deinen Modellcode.

model_1_predicted_labels = make_predictions(model_1, test_data)
plot_random_image_with_predictions(test_data, model_1_predicted_labels, test_labels, class_names)