In [1]:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

# Kostenfunktion (loss function)
## Categorical Crossentropy
Dieses Notebook enthält die Kostenfunktion Categorical Crossentropy. Sie ist sinnvoll, um Wahrscheinlichkeitsverteilungen zu vergleichen. Im Beispiel von CNNs wird diese Funktion dafür eingesetzt, um zu testen, wie unterschiedlich der Output des Netzwerks von dem Zielwert ist, also der Vergleich von einer Klasse gegenüber allen anderen. Die Formel lautet
$$Loss=-\sum_j{y_j\cdot \log{\hat{y}_j}}$$

## Code - Beispiele für Categorical Crossentropy
Der folgende Codeabschnitt zeigt das Ergebnis der Kostenfunktion für verschiedene Inputs. Die Anzahl der Klassen ist auf $4$ begrenzt, um sie gut anzeigen zu können. Im Output zu erkennen ist, dass der absolute Wert der Kostenfunktion mit steigender Annäherung an den Zielvektor immer kleiner wird.
### Implementierung der Funktion
Die Summe wird durch das Skalarprodukt des Zielvektors und der Schätzung gebildet. Der Logarithmus des Schätzungsvektors wird auf ein masked array angewendet und dann wieder mit dem Wert $0$ aufgefüllt, um die Division durch $0$ zu vermeiden.

In [19]:
def categorical_crossentropy(Y, Yhat):
    return -np.dot(Y, np.ma.log(Yhat).filled(0))

target = [0,0,1,0]
print("Target Vector: ", target)
estimate = [0.25,0.25,0.25,0.25]
print(f"Loss for {estimate}: {categorical_crossentropy(target, estimate)}")
estimate = [0.0,0.5,0.5,0.0]
print(f"Loss for {estimate}: {categorical_crossentropy(target, estimate)}")
estimate = [-0.1,-0.1,1.2,0.0]
print(f"Loss for {estimate}: {categorical_crossentropy(target, estimate)}")
estimate = [0,0,1,0]
print(f"Loss for {estimate}: {categorical_crossentropy(target, estimate)}")

Target Vector:  [0, 0, 1, 0]
Loss for [0.25, 0.25, 0.25, 0.25]: 1.3862943611198906
Loss for [0.0, 0.5, 0.5, 0.0]: 0.6931471805599453
Loss for [-0.1, -0.1, 1.2, 0.0]: -0.1823215567939546
Loss for [0, 0, 1, 0]: -0.0
