# Metrik
Es gibt mehrere Möglichkeiten, die Performance eines Neuronalen Netzwerks zu messen. Hier wird die Genauigkeit (accuracy) erläutert und von der Präzision (precision) abgegrenzt. Zur Veranschaulichung dient folgende Wahrheitsmatrix (horizontal sind die aktuellen Werte, vertikal die gemessenen; Beispiel: Es wurden $2$ Werte als Positiv gemessen, obwohl sie Falsch waren).
<table>
    <tr>
        <td></td>
        <td>Wahr</td>
        <td>Falsch</td>
        <td>Gesamt</td>
    </tr>
    <tr>
        <td>Positiv</td>
        <td>4</td>
        <td>2</td>
        <td>6</td>
    </tr>
    <tr>
        <td>Negativ</td>
        <td>1</td>
        <td>3</td>
        <td>4</td>
    </tr>
    <tr>
        <td>Gesamt</td>
        <td>5</td>
        <td>5</td>
        <td>10</td>
    </tr>
</table>
In diesem Notebook wird nur zwischen $2$ Klassen unterschieden, aber die vorgestellten Formeln sind auch auf mehrere Klassen erweiterbar.

## Accuracy
Die Accuracy wird als Quotient von richtig gemessenen Werten durch alle gemessenen Werte gebildet.<br>
Zuerst eine Erklärung der Notation: Die $4$ Felder der Tabelle werden als WP, FP, WN und FN bezeichnet. Der erste Wert steht dabei für den korrekten Wert und der zweite für das gemessene Ergebnis.<br>
Die Formel für die Accuracy lautet: $$acc=\frac{WP+FN}{WP+FP+WN+FN}$$
Im Beispiel oben gibt das einen Wert von $\frac{4+3}{4+2+1+3}=\frac{7}{10}=0.7$

## Precision
Die Precision ist der Anteil der als wahr klassifizierten Ergebnisse an allen Positiven. Hierfür lautet die Formel: $$prec=\frac{WP}{WP+FP}$$
Auf das Beispiel angewandt ergibt sich als Precision $\frac{4}{4+2}=\frac{4}{6}=0.66$

## Abgrenzung
Es gibt nicht eine Metrik, die der anderen überlegen ist. Die jeweils beste Metrik ist vom Problem abhängig. Die Precision ist nützlich in Fällen, in denen ein falsches Ergebnis, das positiv gemessen wird, eine große Auswirkung hat. Ein Beispiel ist die Spam-Detektion. Es sollten möglichst keine wichtigen E-Mails versehentlich in den Spam-Ordner verschoben werden.<br>
Die Accuracy macht Sinn, wenn das Modell den Wert möglichst genau vorhersagen soll, und es keine Unterscheidung zwischen inkorrekt vorhergesagten Werten gibt. Ein Beispiel ist die Bilderkennung, in der nur wichtig ist, dass ein Bild der korrekten Klasse zugordnet wird. Es ist oft egal, welcher Klasse es zugeordnet ist, wenn es inkorrekt klassifiziert wurde.<br>
Folgendes Bild illustriert die Accuracy und die Precision.
<div style="width:40%;margin:auto">
<img src="assets/accuracy_precision.png" alt="Unterscheidung von Accuracy und Precision"/>
<small style="text-align:right;display:block"><a href="https://chemistrygod.com/accuracy-and-precision-in-chemistry">Quelle</a></small>
<div style="text-align:center;color:RGB(117,117,117)">Accuracy und Precision am Beispiel von Zielscheiben</div>
</div>

## Unterschied zwischen Accuracy und Loss
Es wird oft angenommen, dass die Accuracy sich mit der Formel $accuracy=1-loss$ berechnet. Das ist jedoch nicht korrekt.
### 1. Berechnung
Die Accuracy bestimmt sich, wie oben geschrieben, als Anteil der korrekt klassifizierten Bilder. Je nach <br>
Der Loss hingegen wird über folgende Formel berechnet.$$Loss=-\sum_i{y_i\cdot \log{\hat{y}_i}}$$
$y_i$ ist die one-hot-encodierte Klasse des Bildes, also $1$, wenn es die $i$-te Klasse ist, sonst $0$. $\hat{y}$ ist der Outputvektor des CNNs. Es fließt also immer nur $\hat{y}_i$ in die Berechnung des Losses ein. Der Loss ist $0$ für ein Bild, wenn der Outputvektor des Netzwerks gleich der Klasse des Bildes im One-Hot-Encoding ist.
### 2. Bedeutung
Anhand der Accuracy kann die Performance des Netzwerks abgeschätzt werden.<br>
Der Loss wird für die Backpropagation genommen, weil er das Ergebnis des CNNs genauer betrachtet, nämlich als Zahl anstelle dessen, ob die richtige Klasse getroffen wurde oder nicht.<br>
Anders gesagt, bei der Accuracy wird geschaut, welcher Index des Outputs entweder maximal oder über einem Schwellenwert ist. Währenddessen betrachtet der Loss den Wert selbst.