### Genauigkeit der Aussage berechnen

#### Beispiel von vorher

In [17]:
# FashionMNIST: https://github.com/zalandoresearch/fashion-mnist

import gzip
import numpy as np

def open_images(filename):
    with gzip.open(filename, "rb") as file:
        data = file.read()
        return np.frombuffer(data, dtype=np.uint8, offset=16)\
            .reshape(-1, 28, 28)\
            .astype(np.float32)


def open_labels(filename):
    with gzip.open(filename, "rb") as file:
        data = file.read()
        return np.frombuffer(data, dtype=np.uint8, offset=8)
    
X_train = open_images("data/fashion/train-images-idx3-ubyte.gz")
y_train_categories = open_labels("data/fashion/train-labels-idx1-ubyte.gz")

# Sequential: bedeutet, dass man Ebene für Ebene ein Modell definieren kann
from keras.models import Sequential
# Dense: Standard-Layer. Bedeutet, dass alle möglichen Pfeile zwischen allen Neuronen erstellt werden (alles mit allem verknüpfen)
from keras.layers import Dense

model = Sequential()

# Hidden layer 
#  100 Neuronen
#  input_shape: Eingabeformat der Daten (bsw. 784 Zahlen für das 28*28px Image)
#  (784,): Tuple - Python braucht für ein Tuple mit nur einem Wert ein ,
model.add(Dense(100, activation="sigmoid", input_shape=(784,)))

# Ausgabeschicht
#  Hier wird nur ein Neuron gebraucht
model.add(Dense(1, activation="sigmoid" ))

#### Beim Kompilieren kann man Metriken angeben, die mit ausgeben werden sollen, z.B. die Genauigkeit (accuracy)

In [18]:
# compile: generiert effizienteren Code. Nötig, falls es später auf einer GPU ausgeführt wird
# optimizer: Welches Verfahren soll verwendet werden, um die Gewichte zu verstellen (stochastic gradient descent)
# loss: Output-Format & ist eine Aussage über die Größe des Fehlers, der beim Vergleich von x und was als y herauskommen sollte, entsteht. Die Kosten, die man versucht zu minimieren -> (y - ^y) im Quadrat (Fehlergröße)
# accuracy-Parameter übergeben 
model.compile(optimizer="sgd", loss="binary_crossentropy", metrics=["accuracy"])

#### Daten in das gewünschte Format bringen

In [19]:
# Daten ummappen, damit die Daten statt im Format "28x28" als 784 Zahlen representiert werden 
# 60000 Datensätze mit jeweils 784 Einträgen
X_train_mapped = X_train.reshape(60000, 784)

# Für die Ermittlung sollen nur T-Shirts (Kategorie 0) betrachtet werden. Deshalb wird das Array auf true/false (T-Shirt oder nicht) umgemappt
y_train = y_train_categories == 0

### Genauigkeit wird beim Trainieren durch die accuracy-Angabe mit ausgegeben
Nützlich, wenn das Trainieren länger läuft. Man hat so direktes Feedback, wie gut es bereits ist.

In [20]:
# epochs: wie oft die Daten komplett durchlaufen werden
# batch_size: schaue dir die ersten 1000 Bilder an und justiere anhand der Daten die Gewichte nach
# weil immer nur sehr wenig justiert wird, muss man die Daten mehrfach durchlaufen
model.fit(
    X_train_mapped,
    y_train,
    epochs=10,
    batch_size=1000
)

Epoch 1/10
[1m60/60[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.7666 - loss: 0.4928
Epoch 2/10
[1m60/60[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.9240 - loss: 0.1901
Epoch 3/10
[1m60/60[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.9443 - loss: 0.1639
Epoch 4/10
[1m60/60[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.9507 - loss: 0.1469
Epoch 5/10
[1m60/60[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.9518 - loss: 0.1385
Epoch 6/10
[1m60/60[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.9522 - loss: 0.1334
Epoch 7/10
[1m60/60[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.9532 - loss: 0.1301
Epoch 8/10
[1m60/60[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.9536 - loss: 0.1261
Epoch 9/10
[1m60/60[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[

<keras.src.callbacks.history.History at 0x2c805a3e650>

#### Trainingserfolg prüfen
- Theoretisch kann man mit den vorhandenen Daten, mit denen man trainiert hat, testen.
- Da hier aber etwas (z.B. ein Pixel an einer bestimmten Stelle) erkannt worden sein kann, sollte man sich Daten aufheben, mit denen man nicht lernt und diese später als Testlauf durchlaufen lassen -> Problem "Overfitting"
- Gutes Maß: c.a. 75% Trainingsdaten / 25% Testdaten (bei neuronalen Netzen mit vielen Daten wird auch oft mit 10% Testdaten gearbeitet)

In [21]:
# Test mit vorhandenen, trainierten Daten
print(model.evaluate(X_train_mapped, y_train))
# was sind die zwei ausgegebenen Zahlen?
print(model.metrics_names)

[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 823us/step - accuracy: 0.9539 - loss: 0.1187
[0.11923487484455109, 0.9543333053588867]
['loss', 'compile_metrics']


In [22]:
# Test mit Testdaten (-1: zähle selbst die Anzahl an Einträgen)
X_test = open_images("data/fashion/t10k-images-idx3-ubyte.gz").reshape(-1, 784)
y_test = open_labels("data/fashion/t10k-labels-idx1-ubyte.gz") == 0

model.evaluate(X_test, y_test)

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 869us/step - accuracy: 0.9554 - loss: 0.1223


[0.12538842856884003, 0.953000009059906]