# **Übung 4a** Programmierung mit Python mit Anwendungen aus dem Maschinellen Lernen

## Aufgabe 1

Beim Maschinellen Lernen können Klassen helfen, verschiedene Implementierungen von Algorithmen auf den wesentlichen Schnittstellen zu abstrahieren. Um sich selbst ein Bild davon zu machen, schreiben Sie einen kleinen Evaluator, der neben der `LinearRegression` auch noch `ElasticNet` und `SGDRegressor` (oder andere) wiederholt auf verschiedenen Eingangdaten testet. Führen Sie dazu eine Regression wiederholt mit jeder der drei Klassen und verschiedenen Eingangsdaten durch. Variiren Sie die Koeffizienten `c0`, `c1` und `noise_factor` übergeben. Ermitteln Sie jeweils den Fehler zu den vorgegebenen Koeffizienten `c0` und `c1`. Bei `c0` und `c1` handelt es sich um Koeffizienten einer Gerade (Steigung und Achsenabschnitt).

Nachfolgende Zelle enthält die Funktion `get_linear_relationship_sample`. Diese generiert weiterhin, wie in Übung 4, Werte nach folgender linearen Gleichung $f(x) = c0 + x*c1 + N(x)$. $N(x)$ stellt ein von $x$ abhängiges Rauschen da.

In [None]:
import random
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression, ElasticNet, SGDRegressor


def get_value(x, c0, c1, nf):
    return c0 + c1 * x + (random.random()-0.5) * x * x * nf


def get_linear_relationship_sample(c0=9, c1=4, noise_factor=0.1):
    '''
    Erzeugt Punkte in einem bestimmten Bereich nach folgender Funktion f(x) = c0 + x*c1 + N(x)
    N ist ein Zufallsterm
    '''
    X, y = zip(*[(x, get_value(x, c0=c0, c1=c1, nf=noise_factor))
                 for x in np.arange(0.1, 15, 0.01)])
    X = np.array(X).reshape((len(X), 1))
    return train_test_split(
        X, y, test_size=0.2, random_state=0)


In [None]:
p_n_loop = 100
noise_factors = [0.1, 2]
c0s = [0, 40]
c1s = [-1, 4]
regressors = [LinearRegression, ElasticNet, SGDRegressor]


def get_first_value_or_value(a):
    if isinstance(a, list):
        if a:
            return a[0]
        else:
            raise AssertionError('Should never happen')
    else:
        return a


def test_regressor(n_loop, c0, c1, noise_factor, regressor):
    result_c0s = []
    result_c1s = []
    print(f'Testing: {n_loop}, {c0}, {c1}, {noise_factor}, {regressor}')
    for _ in range(n_loop):
        X_train, _, y_train, _ = get_linear_relationship_sample(
            c0=c0, c1=c1, noise_factor=noise_factor)
        r = regressor()
        r.fit(X_train, y_train)
        result_c0s.append(get_first_value_or_value(r.intercept_))
        result_c1s.append(get_first_value_or_value(r.coef_))
    print(
        f'Result: c0 Error {np.square(np.array(result_c0s) - c0).mean()}')
    print(
        f'Result: c1 Error {np.square(np.array(result_c1s) - c1).mean()}')
    print()


for p_noise_factor in noise_factors:
    print(f'Set noise_factor to {p_noise_factor}')
    for p_c0 in c0s:
        for p_c1 in c1s:
            for p_regressor in regressors:
                test_regressor(p_n_loop, p_c0, p_c1,
                               p_noise_factor, p_regressor)
