# Klassifikation von MNIST und Fashion-MNIST
In diesem Notebook vergleichen wir verschiedene neuronale Netzarchitekturen zur Klassifikation von Bildern aus dem MNIST- und Fashion-MNIST-Datensatz.

## Bibliotheken importieren

In [None]:
import keras as K
import matplotlib.pyplot as plt
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

## MNIST-Datensatz laden und vorbereiten

In [None]:
mnist = K.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train = x_train / 255.0
x_test = x_test / 255.0

## One-Hot-Encoding der Zielvariablen

In [None]:
y_train = K.utils.to_categorical(y_train)
y_test = K.utils.to_categorical(y_test)

## Feedforward-Netzwerk erstellen
Ein einfaches Dense-Netz mit zwei Hidden-Layern je 128 Neuronen.

In [None]:
model = K.models.Sequential()
model.add(K.layers.Flatten())
model.add(K.layers.Dense(128, activation='relu'))
model.add(K.layers.Dense(128, activation='relu'))
model.add(K.layers.Dense(10, activation='softmax'))

## Kompilieren des Modells

In [None]:
model.compile(
    optimizer='adam',
    loss='categorical_crossentropy',
    metrics=['accuracy']
)

## Training des Feedforward-Netzes

In [None]:
history = model.fit(x_train, y_train, epochs=30, batch_size=128, validation_split=0.3)

## Trainingsverlauf (Feedforward-Netz)

In [None]:
fig, ax = plt.subplots()
ax.set_title('Accuracy over epochs')
ax.set_xlabel('epochs')
ax.set_ylabel('accuracy')
ax.plot(history.history['accuracy'], label='train')
ax.plot(history.history['val_accuracy'], label='validation')
ax.legend(loc='upper left')
plt.show()
plt.savefig('../figs/mnist_accuracy.png')

## Aufbau eines Convolutional Neural Networks (CNN) mit Fashion-MNIST
Ziel: Verbesserung der Genauigkeit gegenüber einem einfachen Feedforward-Netz.

In [None]:
fashion = K.datasets.fashion_mnist
(x_train_mf, y_train_mf), (x_test_mf, y_test_mf) = fashion.load_data()
x_train_mf = x_train_mf / 255.0
x_test_mf = x_test_mf / 255.0
y_train_mf = K.utils.to_categorical(y_train_mf)
y_test_mf = K.utils.to_categorical(y_test_mf)

## CNN-Architektur definieren

In [None]:
model2 = Sequential()
model2.add(Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))
model2.add(MaxPooling2D((2, 2)))
model2.add(Flatten())
model2.add(Dense(100, activation='relu'))
model2.add(Dense(10, activation='softmax'))

## Kompilierung des CNN-Modells

In [None]:
model2.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

In [None]:
x_train_mf = x_train_mf.reshape(-1, 28, 28, 1)
x_test_mf = x_test_mf.reshape(-1, 28, 28, 1)

## Training des CNNs auf Fashion-MNIST

In [None]:
history = model2.fit(
    x_train_mf, y_train_mf,
    epochs=30,
    batch_size=128,
    validation_data=(x_test_mf, y_test_mf)
)

## Visualisierung des CNN-Trainingsverlaufs

In [None]:
fig, ax = plt.subplots()
ax.set_title('Accuracy over epochs')
ax.set_xlabel('epochs')
ax.set_ylabel('accuracy')
ax.plot(history.history['accuracy'], label='train')
ax.plot(history.history['val_accuracy'], label='validation')
ax.legend(loc='upper left')
plt.show()
plt.savefig('../figs/mnist_accuracy_convolutional.png')

## CNN mit Dropout zur Vermeidung von Overfitting
Ein Dropout-Layer deaktiviert während des Trainings zufällig 10 % der Neuronen.

In [None]:
model = Sequential()
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))
model.add(MaxPooling2D((2, 2)))
model.add(Dropout(0.1))
model.add(Flatten())
model.add(Dense(100, activation='relu'))
model.add(Dense(10, activation='softmax'))