# Bewertungskriterien Klassifikation

Eine Verkehrsüberwachungssoftware soll um einen Klassifikations-Algorithmus
ergänzt werden, um automatisch Fahrradfahrer von Autos zu unterscheiden. Der
Klassifikations-Algorithmus wurde dazu auf $n_\text{train}=2000$ Bildern von
Fahrrädern und Autos trainiert. Die Anwendung des fertigen Algorithmus auf einen
Test-Datensatz ergab folgende Confusionsmatrix:

<table><thead>
  <tr>
    <th colspan="2" rowspan="2"></th>
    <th colspan="2">Algorithmus<br></th>
  </tr>
  <tr>
    <th><strong>Fahrrad</strong></th>
    <th><strong>Auto</strong></th>
  </tr></thead>
<tbody>
  <tr>
    <td rowspan="2"><strong>Tatsächlich</strong></td>
    <td><strong>Fahrrad</strong></td>
    <td>400</td>
    <td>60</td>
  </tr>
  <tr>
    <td><strong>Auto</strong></td>
    <td>60</td>
    <td>200</td>
  </tr>
</tbody>
</table>

Berechnen Sie
- den Umfang der Test-Daten $n_\text{test}$
- die erreichte Genauigkeit, Präzision, Recall und $F_1$-Score

Berechnen Sie außerdem
- die True-Positive-Rate (Anteil der korrekt klassifizierten Fahrradbildern
  unter allen Fahrradbildern)
- die False-Positive-Rate (Anteil der als Fahrrad klassifizierten Bildern unter
  allen Autobildern)
- die True-Negative- und False-Negative-Rate (analog).

In [1]:
TP = 400
FN = 60
FP = 60
TN = 200

In [2]:
n_test = TP + FN + FP + TN
print(f'Umfang Test-Daten: {n_test}')

Umfang Test-Daten: 720


$$
\begin{aligned}
    \text{Genauigkeit } &= \frac{\text{TP} + \text{TN}}{n} \\
    \text{Präzision } &= \frac{\text{TP}}{\text{TP} + \text{FP}} \\
    \text{Recall } &= \frac{\text{TP}}{\text{TP} + \text{FN}} \\
    F_1 &= \frac{2 \cdot \text{Präzision} \cdot \text{Recall}}{
        \text{Präzision} + \text{Recall}}
\end{aligned}
$$

In [3]:
acc = (TP + TN) / n_test
print(f'acc: {acc:.4f}')

prec = TP / (TP + FP)
print(f'prec: {prec:.4f}')

recall = TP / (TP + FN)
print(f'recall: {recall:.4f}')

f1 = 2 * prec * recall / (prec + recall)
print(f'f1: {f1:.4f}')

acc: 0.8333
prec: 0.8696
recall: 0.8696
f1: 0.8696


<img src="./assets/metriken.png" alt="Metriken" width=500>

In [4]:
# Anteil der korrekten klassifizierten Fahrradbilder unter allen Fahrradbildern
true_positive_rate = TP / (TP + FN)
print(f'true_positive_rate: {true_positive_rate:.4f}')

# Anteil der als Fahrrad klassifizierten Bilder unter allen Autobildern
false_positive_rate = FP / (FP + TN)
print(f'false_positive_rate: {false_positive_rate:.4f}')

# Anteil der korrekten klassifizierten Autobilder und allen Autobildern
true_negative_rate = TN / (FP + TN)
print(f'true_negative_rate: {true_negative_rate:.4f}')

# Anteil der als Auto klassifizierten Bilder unter allen Fahrradbildern
false_negative_rate = FN / (TP + FN)
print(f'false_negative_rate: {false_negative_rate:.4f}')

true_positive_rate: 0.8696
false_positive_rate: 0.2308
true_negative_rate: 0.7692
false_negative_rate: 0.1304
