##### Copyright 2018 The TensorFlow Authors.

In [None]:
#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

In [None]:
#@title MIT License
#
# Copyright (c) 2017 François Chollet
#
# Permission is hereby granted, free of charge, to any person obtaining a
# copy of this software and associated documentation files (the "Software"),
# to deal in the Software without restriction, including without limitation
# the rights to use, copy, modify, merge, publish, distribute, sublicense,
# and/or sell copies of the Software, and to permit persons to whom the
# Software is furnished to do so, subject to the following conditions:
#
# The above copyright notice and this permission notice shall be included in
# all copies or substantial portions of the Software.
#
# THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
# IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
# FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
# THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
# LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING
# FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
# DEALINGS IN THE SOFTWARE.

# Grundlegende Klassifizierung: Bilder von Kleidung klassifizieren

<table class="tfo-notebook-buttons" align="left">
  <td>
    <a target="_blank" href="https://www.tensorflow.org/tutorials/keras/classification"><img src="https://www.tensorflow.org/images/tf_logo_32px.png" />View on TensorFlow.org</a>
  </td>
  <td>
    <a target="_blank" href="https://colab.research.google.com/github/tensorflow/docs/blob/master/site/en/tutorials/keras/classification.ipynb"><img src="https://www.tensorflow.org/images/colab_logo_32px.png" />Run in Google Colab</a>
  </td>
  <td>
    <a target="_blank" href="https://github.com/tensorflow/docs/blob/master/site/en/tutorials/keras/classification.ipynb"><img src="https://www.tensorflow.org/images/GitHub-Mark-32px.png" />View source on GitHub</a>
  </td>
  <td>
    <a href="https://storage.googleapis.com/tensorflow_docs/docs/site/en/tutorials/keras/classification.ipynb"><img src="https://www.tensorflow.org/images/download_logo_32px.png" />Download notebook</a>
  </td>
</table>

Diese Anleitung trainiert ein neuronales Netzwerk, um Bilder von Kleidung, wie Turnschuhe und Hemden, zu klassifizieren. Dies ist ein schneller Überblick über ein komplettes TensorFlow-Programm, wobei die Details Schritt für Schritt erklärt werden. Es ist nicht zwingend notwendig alle Details komplett nachzuvollziehen.

Dieser Leitfaden verwendet [tf.keras](https://www.tensorflow.org/guide/keras), eine High-Level-API zum Erstellen und Trainieren von Modellen in TensorFlow.

In [None]:
# TensorFlow und tf.keras
import tensorflow as tf

# Hilfsbibliotheken
import numpy as np
import matplotlib.pyplot as plt

print("TensorFlow Version:", tf.__version__)

## Importieren des Fashion MNIST-Datensatzes

Dieser Leitfaden verwendet den [Fashion MNIST](https://github.com/zalandoresearch/fashion-mnist) Datensatz, der 70.000 Graustufenbilder in 10 Kategorien enthält. Die Bilder zeigen einzelne Kleidungsstücke in niedriger Auflösung (28 x 28 Pixel), wie hier zu sehen:

<table>
  <tr><td>
    <img src="https://tensorflow.org/images/fashion-mnist-sprite.png"
         alt="Fashion MNIST sprite"  width="600">
  </td></tr>
  <tr><td align="center">
    <b>Abbildung 1.</b> <a href="https://github.com/zalandoresearch/fashion-mnist">Fashion-MNIST samples</a> (von Zalando, MIT License).<br/>&nbsp;
  </td></tr>
</table>

Fashion MNIST ist als Ersatz für den klassischen [MNIST](http://yann.lecun.com/exdb/mnist/)-Datensatz gedacht, der oft als „Hello, World“ für maschinelle Lernprogramme für Computer Vision verwendet wird. Der MNIST-Datensatz enthält Bilder von handgeschriebenen Ziffern (0, 1, 2 usw.) in einem Format, das mit dem der Kleidungsstücke, die Sie hier verwenden werden, identisch ist.

Dieser Leitfaden verwendet Fashion MNIST zur Abwechslung und weil es ein etwas schwierigeres Problem als das normale MNIST ist. Beide Datensätze sind relativ klein und werden verwendet, um zu überprüfen, ob ein Algorithmus wie erwartet funktioniert. Sie sind gute Ausgangspunkte zum Testen und Debuggen von Code.

Hier werden 60.000 Bilder zum Trainieren des Netzwerks verwendet und 10.000 Bilder, um zu bewerten, wie genau das Netzwerk gelernt hat, Bilder zu klassifizieren. Sie können auf die Fashion MNIST direkt von TensorFlow aus zugreifen. Importieren und [lade die Fashion MNIST Daten](https://www.tensorflow.org/api_docs/python/tf/keras/datasets/fashion_mnist/load_data) direkt aus TensorFlow:

In [None]:
fashion_mnist = tf.keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

Das Laden des Datensatzes liefert vier NumPy-Arrays:

* Die Arrays `train_images` und `train_labels` sind die *Trainingsmenge* - die Daten, die das Modell zum Lernen verwendet.
* Das Modell wird mit der *Testmenge*, den Arrays „test_images“ und „test_labels“ getestet.

Die Bilder sind 28x28 NumPy-Arrays, mit Pixelwerten von 0 bis 255. Die *Labels* sind eine Reihe von Ganzzahlen, die von 0 bis 9 reichen. Sie entsprechen der *Klasse* der Kleidung, die das Bild darstellt:

<table>
  <tr>
    <th>Label</th>
    <th>Klasse</th>
  </tr>
  <tr>
    <td>0</td>
    <td>T-shirt/top</td>
  </tr>
  <tr>
    <td>1</td>
    <td>Trouser</td>
  </tr>
    <tr>
    <td>2</td>
    <td>Pullover</td>
  </tr>
    <tr>
    <td>3</td>
    <td>Dress</td>
  </tr>
    <tr>
    <td>4</td>
    <td>Coat</td>
  </tr>
    <tr>
    <td>5</td>
    <td>Sandal</td>
  </tr>
    <tr>
    <td>6</td>
    <td>Shirt</td>
  </tr>
    <tr>
    <td>7</td>
    <td>Sneaker</td>
  </tr>
    <tr>
    <td>8</td>
    <td>Bag</td>
  </tr>
    <tr>
    <td>9</td>
    <td>Ankle boot</td>
  </tr>
</table>

Jedes Bild wird einem einzelnen Label zugeordnet. Da die *Klassennamen* nicht im Datensatz enthalten sind, speichern wir sie hier, um sie später beim Plotten der Bilder zu verwenden:

In [None]:
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

## Erkunden der Daten

Bevor wir das Modell trainieren, wollen wir uns das Format des Datensatzes ansehen. Die folgende Abbildung zeigt, dass der Trainingsdatensatz 60.000 Bilder enthält, wobei jedes Bild mit 28 x 28 Pixeln dargestellt wird:

In [None]:
train_images.shape

Ebenso gibt es 60.000 Labels in der Trainingsmenge:

In [None]:
len(train_labels)

Jede Label ist eine ganze Zahl zwischen 0 und 9:

In [None]:
train_labels

Der Testsatz besteht aus 10.000 Bildern. Auch hier wird jedes Bild als 28 x 28 Pixel dargestellt:

In [None]:
test_images.shape

Und der Testsatz enthält 10.000 Labels:

In [None]:
len(test_labels)

## Vorverarbeitung der Daten

Vor dem Training des Netzes müssen die Daten vorverarbeitet werden. Wenn wir das erste Bild im Trainingssatz untersuchen, stellen wir fest, dass die Pixelwerte in den Bereich von 0 bis 255 fallen:

In [None]:
plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()

Nun skalieren wir diese Werte auf einen Bereich von 0 bis 1, bevor wir sie in das neuronale Netzmodell eingeben. Dazu teilen wir die Werte durch 255. Es ist wichtig, dass die *Trainingsmenge* und die *Testmenge* auf dieselbe Weise vorverarbeitet werden:

In [None]:
train_images = train_images / 255.0

test_images = test_images / 255.0

Um zu überprüfen, ob die Daten im richtigen Format vorliegen und wir bereit sind, das Netzwerk zu erstellen und zu trainieren, zeigen wir die ersten 25 Bilder aus dem *Trainingsset* an und geben den Klassennamen unter jedem Bild an.

In [None]:
plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    plt.xlabel(class_names[train_labels[i]])
plt.show()

## Erstellen des Modells

Der Aufbau des neuronalen Netzes erfordert die Konfiguration der Layer (Schichten) und die anschließende Kompilierung des Modells.

### Einrichten der Layer

Der Grundbaustein eines neuronalen Netzes ist ein [*Layer*](https://www.tensorflow.org/api_docs/python/tf/keras/layers). Layer extrahieren Repräsentationen aus den Daten, mit denen sie gespeist werden.

Der Großteil des Deep Learning besteht aus der Verkettung einfacher Layer. Die meisten Layer, wie z. B. `tf.keras.layers.Dense`, haben Parameter, die während des Trainings gelernt werden.

In [None]:
model = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28, 28)),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dense(10)
])

Im ersten Layer dieses Netzwerks, `tf.keras.layers.Flatten`, wird das Format der Bilder von einem zweidimensionalen Array (von 28 mal 28 Pixeln) in ein eindimensionales Array (von 28 * 28 = 784 Pixeln) umgewandelt. Stellen Sie sich diese Layer so vor, dass die Pixelreihen im Bild entstapelt und aneinandergereiht werden. Dieses Layer muss keine Parameter lernen; sie formatiert lediglich die Daten neu.

Nachdem die Pixel geglättet wurden, besteht das Netz aus einer Folge von zwei „tf.keras.layers.Dense“-Layern. Dies sind dicht verbundene oder vollständig verbundene neuronale Layer. Das erste „Dense“-Layer hat 128 Knoten (oder Neuronen). Das zweite (und letzte) Layer gibt ein logits-Array mit einer Länge von 10 zurück. Jeder Knoten enthält eine Punktzahl, die angibt, dass das aktuelle Bild zu einer der 10 Klassen gehört.

### Kompilieren des Modells

Bevor das Modell für das Training bereit ist, benötigt es noch einige Einstellungen. Diese werden beim Schritt [*Kompilieren*](https://www.tensorflow.org/api_docs/python/tf/keras/Model#compile) des Modells hinzugefügt:

* [*Loss-Funktion*](https://www.tensorflow.org/api_docs/python/tf/keras/losses) - Hiermit wird gemessen, wie genau das Modell während des Trainings ist. Sie wollen diese Funktion minimieren, um das Modell in die richtige Richtung zu „lenken“.
* [*Optimizer*](https://www.tensorflow.org/api_docs/python/tf/keras/optimizers) - Hiermit wird das Modell auf der Grundlage der Daten, die es sieht, und seiner Verlustfunktion aktualisiert.
* [*Metrics*](https://www.tensorflow.org/api_docs/python/tf/keras/metrics) - Dient zur Überwachung der Trainings- und Testschritte. Das folgende Beispiel verwendet *Genauigkeit*, den Anteil der Bilder, die korrekt klassifiziert wurden.

In [None]:
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

## Das Modell trainieren

Das Trainieren des neuronalen Netzmodells erfordert die folgenden Schritte:

1. Einspeisung der Trainingsdaten in das Modell. In diesem Beispiel befinden sich die Trainingsdaten in den Arrays `train_images` und `train_labels`.
2. Das Modell lernt, Bilder und Bezeichnungen zuzuordnen.
3. Das Modell macht eine Vorhersagen über einen Testsatz - in diesem Beispiel das Array „test_images“.
4. Überprüfung, ob die Vorhersagen mit den Bezeichnungen aus dem Array „test_labels“ übereinstimmen.

### Das Modell füttern

Um mit dem Training zu beginnen, rufen Sie die Methode [`model.fit`](https://www.tensorflow.org/api_docs/python/tf/keras/Model#fit) auf.  Diese Methode wird so genannt, weil sie das Modell an die Trainingsdaten „anpasst“:

In [None]:
model.fit(train_images, train_labels, epochs=10)

Während das Modell trainiert, werden die Verlust- und Genauigkeitsmetriken angezeigt. Dieses Modell erreicht eine Genauigkeit von etwa 0,91 (oder 91 %) bei den Trainingsdaten.

### Bewerten Sie die Genauigkeit

Vergleichen Sie als Nächstes, wie das Modell im Testdatensatz abschneidet:

In [None]:
test_loss, test_acc = model.evaluate(test_images,  test_labels, verbose=2)

print('\nTest Genauigkeit:', test_acc)

Es stellt sich heraus, dass die Genauigkeit im Testdatensatz etwas geringer ist als die Genauigkeit im Trainingsdatensatz. Diese Diskrepanz zwischen Trainingsgenauigkeit und Testgenauigkeit stellt eine *Overfitting* (Überanpassung) dar. Overfitting liegt vor, wenn ein Modell für maschinelles Lernen bei neuen, zuvor unbekannten Eingaben schlechter abschneidet als bei den Trainingsdaten. Ein überangepasstes Modell „merkt“ sich das Rauschen und die Details im Trainingsdatensatz bis zu einem Punkt, an dem es sich negativ auf die Leistung des Modells bei den neuen Daten auswirkt. Für weitere Informationen:
*   [Demonstrattion von Overfitting](https://www.tensorflow.org/tutorials/keras/overfit_and_underfit#demonstrate_overfitting)
*   [Strategien um Overfitting zu verhindern](https://www.tensorflow.org/tutorials/keras/overfit_and_underfit#strategies_to_prevent_overfitting)

### Vorhersagen treffen

Nachdem Sie das Modell trainiert haben, können Sie es verwenden, um Vorhersagen über einige Bilder zu treffen.
Wir fügen ein Softmax-Layer hinzu, um die linearen Ausgaben des Modells - [logits](https://developers.google.com/machine-learning/glossary#logits) - in Wahrscheinlichkeiten umzuwandeln, die leichter zu interpretieren sind.

In [None]:
probability_model = tf.keras.Sequential([model, 
                                         tf.keras.layers.Softmax()])

In [None]:
predictions = probability_model.predict(test_images)

Hier hat das Modell die Bezeichnung für jedes Bild in der Testgruppe vorhergesagt. Werfen wir einen Blick auf die erste Vorhersage:

In [None]:
predictions[0]

Eine Vorhersage ist eine Reihe von 10 Zahlen. Sie stellen die „Zuversicht“ des Modells dar, dass das Bild mit jedem der 10 verschiedenen Kleidungsstücke übereinstimmt. Sie können sehen, welches Label den höchsten Vertrauenswert hat:

In [None]:
np.argmax(predictions[0])

Das Modell ist also sehr zuversichtlich, dass es sich bei diesem Bild um eine Stiefelette oder `class_names[9]` handelt. Die Prüfung des Labels zeigt, dass diese Klassifizierung richtig ist:

In [None]:
test_labels[0]

Stellen wir dies grafisch dar, um den vollständigen Satz von 10 Klassenvorhersagen zu betrach:

In [None]:
def plot_image(i, predictions_array, true_label, img):
  true_label, img = true_label[i], img[i]
  plt.grid(False)
  plt.xticks([])
  plt.yticks([])

  plt.imshow(img, cmap=plt.cm.binary)

  predicted_label = np.argmax(predictions_array)
  if predicted_label == true_label:
    color = 'blue'
  else:
    color = 'red'

  plt.xlabel("{} {:2.0f}% ({})".format(class_names[predicted_label],
                                100*np.max(predictions_array),
                                class_names[true_label]),
                                color=color)

def plot_value_array(i, predictions_array, true_label):
  true_label = true_label[i]
  plt.grid(False)
  plt.xticks(range(10))
  plt.yticks([])
  thisplot = plt.bar(range(10), predictions_array, color="#777777")
  plt.ylim([0, 1])
  predicted_label = np.argmax(predictions_array)

  thisplot[predicted_label].set_color('red')
  thisplot[true_label].set_color('blue')

### Vorhersagen verifizieren

Nachdem das Modell trainiert wurde, können Sie es verwenden, um Vorhersagen über einige Bilder zu treffen.

Schauen wir uns das 0. Bild, die Vorhersagen und das Vorhersagefeld an. Richtige vorhergesagte Labels sind blau und falsch vorhergesagte Labels sind rot. Die Zahl gibt den Prozentsatz (von 100) für die vorhergesagten Labels an.

In [None]:
i = 0
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions[i], test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions[i],  test_labels)
plt.show()

In [None]:
i = 12
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions[i], test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions[i],  test_labels)
plt.show()

Nun zeichnen wir mehrere Bilder mit ihren Vorhersagen. Beachte, dass das Modell auch dann falsch liegen kann, wenn es sehr zuverlässig ist.

In [None]:
# Plotte die ersten X Testbilder, ihre vorhergesagten Label und die wahren Label.
# Richtige Vorhersagen werden blau und falsche Vorhersagen rot eingefärbt.
num_rows = 5
num_cols = 3
num_images = num_rows*num_cols
plt.figure(figsize=(2*2*num_cols, 2*num_rows))
for i in range(num_images):
  plt.subplot(num_rows, 2*num_cols, 2*i+1)
  plot_image(i, predictions[i], test_labels, test_images)
  plt.subplot(num_rows, 2*num_cols, 2*i+2)
  plot_value_array(i, predictions[i], test_labels)
plt.tight_layout()
plt.show()

## Verwenden des trainierten Modells

Verwenden wir schließlich das trainierte Modell, um eine Vorhersage für ein einzelnes Bild zu treffen.

In [None]:
# Nehmen eines Bildes aus dem Testdatensatz.
img = test_images[1]

print(img.shape)

tf.keras"-Modelle sind dafür optimiert, Vorhersagen für einen *Batch* oder eine Sammlung von Beispielen auf einmal zu treffen. Dementsprechend müssen Sie, auch wenn Sie ein einzelnes Bild verwenden, dieses zu einer Liste hinzufügen:

In [None]:
# Hinzufügen des Bildes zu einem Batch
img = (np.expand_dims(img,0))

print(img.shape)

Bestimmen wir nun das richtige Label für dieses Bild:

In [None]:
predictions_single = probability_model.predict(img)

print(predictions_single)

In [None]:
plot_value_array(1, predictions_single[0], test_labels)
_ = plt.xticks(range(10), class_names, rotation=45)
plt.show()

tf.keras.Model.predict“ gibt eine Liste von Listen zurück - eine Liste für jedes Bild im Datenstapel. Erfassen Sie die Vorhersagen für unser (einziges) Bild im Stapel:

In [None]:
np.argmax(predictions_single[0])

Und das Modell sagt wie erwartet das Label voraus.