# Aufgabe 1

Implementieren Sie ein Perzeptron zur binären Klassifikation mit Python und Numpy.
Ihr Code sollte eine Methode train(x,y) haben, die einen Numpy-Array x an Eingabedaten
und einen gleich langen Numpy-Array y an Labels bekommt und eine Methode infer(x), die
einen Numpy-Array x an Eingabedaten bekommt und Labels dazu zurück gibt. Sie können sich
die Aufgabe erleichtern, wenn Sie nur xi ∈ R2 zulassen, also dass die Instanzen der Daten jeweils
zweidimensional sind (und damit ist x eine Punktmenge in der Ebene). 

In [2]:
import numpy as np

class Perceptron:
    def __init__(self, learning_rate=0.01, epochs=1000):
        self.learning_rate = learning_rate
        self.epochs = epochs
        # Weights
        self.W = None
        # Bias
        self.b = None

    def train(self, x, y):
        num_of_samples, num_of_features = x.shape

        # Initialisiere Gewichte und Bias mit Nullen
        self.W = np.zeros(num_of_features)
        self.b = 0

        # Iteriere über die Anzahl der Epochen
        for _ in range(self.epochs):
            for i, j in enumerate(x):
                linear_output = np.dot(j, self.W) + self.b
                # Aktiviere die Funktion (Schrittfunktion)
                y_pred = self._activation_function(linear_output)
                
                # Update der Gewichte und des Bias, falls es einen Fehler gibt
                update = self.learning_rate * (y[i] - y_pred)
                self.W += update * j
                self.b += update

    def infer(self, x):
        # Wendet die Gewichtung und den Bias auf die Eingabedaten an und gibt die Vorhersage zurück
        linear_output = np.dot(x, self.W) + self.b
        y_pred = self._activation_function(linear_output)
        return y_pred

    def _activation_function(self, x):
        # Schrittfunktion: Rückgabe 1, wenn der Input >= 0 ist, sonst -1
        return np.where(x >= 0, 1, -1)

# Beispielnutzung des Perzeptrons:

# Erstellen von Trainingsdaten (Punkte im R²) und ihren Labels
x_train = np.array([[1, 1], [2, 2], [1, -1], [-2, -2]])
y_train = np.array([1, 1, -1, -1])

# Erstellen und Trainieren des Perzeptrons
perceptron = Perceptron(learning_rate=0.1, epochs=10)
perceptron.train(x_train, y_train)

# Inferenzen auf neuen Daten
x_test = np.array([[0.5, 0.5], [-1, -1], [3, 3]])
predictions = perceptron.infer(x_test)
print("Vorhersagen:", predictions)


Vorhersagen: [ 1 -1  1]


# Aufgabe 2
Generieren Sie geeignete synthetische Daten für eine binäre Klassifikation. Dazu
dürfen Sie auch Scipy und Scikit-learn verwenden. Ihr Code sollte das in einer Methode generate
tun. Sie haben bei der Verteilung der Daten freie Hand.

# Aufgabe 3

Evaluieren Sie Ihre Implementierung des Perzeptrons systematisch anhand der
synthetischen Daten und einem Train-Test-Split. Dazu dürfen Sie auch Scipy und Scikit-learn
verwenden. Ihr Programm sollte das bei Aufruf von python blatt1.py ausführen und mit
print den Fehler (Anteil der falsch klassifizierten) ausgeben. In einem Notebook sollte das Ergebnis
nach Ausführen aller Zellen zu sehen sein.

# Aufgabe 4

Evaluieren Sie Ihre Implementierung des Perzeptrons anhand des Iris-Flower-Datasets,
aus dem Sie nur die Spezies ‘setosa’ und ‘versicolor’ auswählen. Dazu dürfen Sie auch Scipy
und Scikit-learn verwenden. Geben Sie mit print den Fehler auf dem gesamten Datensatz nach
Training auf dem gesamten Datensatz aus.
Wenn Sie sich das ganze visualisieren möchten, empfiehlt sich, aus dem Iris-Flower-Datensatz
zwei Attribute auszuwählen. Achtung: es macht einen Unterschied, ob der ganze Datensatz (mit 4
Attributen) zum Training verwendet wird und nur die Visualisierung in 2 Dimensionen stattfindet,
oder ob bereits das Training mit nur 2 Attributen durchgeführt wird. Überlegen Sie sich, warum.