# 8.3 Training eines Perzeptrons mit Scikit-Learn

Nachdem wir im letzten Abschnitt ein Perzeptron händisch für die Klassifikationsaufgabe des logischen Oders trainiert haben, benutzen wir nun Scikit-Learn.

## Lernziele

```{admonition} Lernziele
:class: important
* Sie können das Perzeptron-Modell von Scikit-Learn laden und mit den gegebenen Trainingsdaten trainieren.
* Sie wissen, wie Sie auf die Gewichte des gelernten Modells zugreifen.
```


## Das logische Oder Klassifikationsproblem - diesmal mit Scikit-Learn 

Im letzten Abschnitt {ref}`perzeptron_training_logisches_oder` haben wir
händisch ein Perzeptron trainiert. Zur Erinnerung, wenn wir die Bias-Einheit
weglassen, lautet das logische Oder in Tabellenform wie folgt:

x1 | x2 | y
---|----|---
 0 | 0  | 0
 0 | 1  | 1
 1 | 0  | 1
 1 | 1  | 1

Diese Daten formulieren wir nun als eine Inputmatrix $X$ mit den Spalten x1 und
x2. Für die Erzeugung und Weiterverarbeitung der Matrizen laden wir das Modul
Numpy.

In [None]:
import numpy as np

X = np.array([
    [0, 0],
    [0, 1],
    [1, 0],
    [1, 1]
    ])

Den Output formulieren wir als Vektor, ebenfalls mit Hilfe des Numpy-Moduls.

In [None]:
y = np.array([0, 1, 1, 1])

Nun wählen wir das Perzeptron als das zu trainierende ML-Modell aus. Direkt beim
Laden des Modells legen wir die Hyperparameter des Modells fest. Welche
Hyperparameter ein Modell hat, steht in der
[Perzeptron-Dokumentation](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Perceptron.html?highlight=perceptron#sklearn.linear_model.Perceptron).
In diesem Fall wäre beispielsweise die Lernrate ein Hyperparameter. Laut
Dokumentation wird die Lernrate beim Scikit-Learn-Perzeptron mit `eta0`
bezeichnet. Der Python-Code, um das Perzeptron-Modell mit einer Lernrate von 1
zu laden, lautet also wie folgt:

In [None]:
from sklearn.linear_model import Perceptron 
modell = Perceptron(eta0 = 1.0)

Nun können wir das Perzeptron-Modell mit den Input- und Outputdaten trainieren, indem wir die `.fit()`-Methode aufrufen.

In [None]:
modell.fit(X,y)

Nachdem wir den letzten Python-Befehl ausgeführt haben, passiert scheinbar
nichts. Nur der Klassenname `Perceptron()` des Objekts `modell` wird ausgegeben
(wenn Sie den Code interaktiv ausführen). Intern wurde jedoch das
Perzeptron-Modell trainiert, d.h. die Gewichte des Perzeptrons wurden iterativ
bestimmt. Die Gewichte sind nun in dem Objekt `modell` gespeichert. Davon können
wir uns überzeugen, indem wir auf die Attribute des Objekts zugreifen und diese
anzeigen lassen. Die Gewichte sind in dem Attribut `.coef_` gespeichert, während
das Gewicht der Bias-Einheit sich im Attribut `.intercept_` befindet.

In [None]:
print(modell.coef_)
print(modell.intercept_)

Zuletzt können wir das trainierte Perzeptron-Modell Prognosen treffen lassen.
Was prognostiziert das Modell beispielsweise für $x_1=0$ und $x_2=1$? Das
tatsächliche Ergebnis der logischen Oder-Verknüpfung ist $y=1$, was liefert das
Perzeptron?

In [None]:
y_prognose = modell.predict(np.array([[0, 1]]))
print(y_prognose)

Wir können auch gleich für alle Datensätze eine Prognose erstellen.

In [None]:
y_prognose = modell.predict(X)
print(y_prognose)

Tatsächlich funktioniert unser trainiertes Perzeptron zu 100 % korrekt und ist
damit validiert. Bei nur vier Datensätzen lässt sich relativ leicht überblicken,
dass alle vier Prognosen korrekt sind. Sobald die Datenanzahl zunimmt, wird es
schwieriger, den Überblick zu behalten. Daher stellt Scikit-Learn die Methode
`.score()` zur Verfügung, die bei Klassifikatoren die Anzahl der korrekt
prognostizierten Outputs im Verhältnis zur Gesamtanzahl berechnet. Das Ergbnis
ist also eine Bewertung zwischen 0 (keine einzige korrekte Prognose) und 1
(perfekt Prognose).

In [None]:
genauigkeit = modell.score(X, y)
print(genauigkeit)

## Zusammenfassung und Ausblick

Mit Scikit-Learn steht schon eine Implementierung des Perzeptrons zur Verfügung,
die auch bei größeren Datenmengen eine binäre Klassifikation erlaubt. Welche
Daten dabei überhaupt binär klassifiziert können, klären wir in einem der
folgenden Abschnitte.