# Machine-Learning

## √úberwachtes Lernen; Regressionsgerade ohne Bias

### Die Daten

![Schuhe](Bilder/Schuh.png "Schuhe")

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

***Stell dir vor, du m√∂chtest dir ein Paar neue Schuhe kaufen, hast aber keine Ahnung, welche Schuhgr√∂√üe du hast.***

In Europa gibt es Schuhgr√∂√üen, die *irgendwie* zwischen ungef√§hr 30 und 48 liegen. Aber was ist f√ºr dich die passende Gr√∂√üe?

Du kannst nat√ºrlich die L√§nge deines Fu√ües messen: ca. 26 cm vielleicht! Doch was hilft das?

Also machen wir doch einmal ein Experiment in deiner Klasse, also:
1. Eine Tabelle anlegen!
1. Jedes Kind soll seinen Schuh ausziehen;
2. die Fu√ül√§nge messen;
2. die Schuhgr√∂√üe (am Schuh) ablesen;
2. die Daten in der Tabelle notieren.

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Es k√∂nnte sich dabei vielleicht die folgende Tabelle ergeben:

Fusslaenge (in cm)| Schuhgroesse (EU-Norm)
:---: | :---:
27 | 42
27.5 | 43
23.5 | 37
21.5 | 34
23 | 36
28.5 | 44
24.5 | 38
24.4 | 37
28.6 | 44
28.4 | 43


<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Nat√ºrlich k√∂nntest du jetzt raten (oder klug interpolieren), um deine richtige Gr√∂√üe zu finden. Doch wir wollen ein Programm erstellen, das einen allgemeinen Zusammenhang zwischen den Tabellenspalten aus den Beispielen ***lernt***.

### Visualisieren

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Dazu lassen wir die Daten (in einer Datei mit dem Namen **schuhe.txt** abgelegt) in ein Koordinatensystem eintragen:

In [None]:
# Das ist eine Bibliothek, mir der man Zeichnungen anfertigen kann
import matplotlib.pyplot as plt

# Das ist eine Bibliothek, mir der man Listen verwalten kann
import numpy as np


In [None]:
# dies ist ein Tool zum Testen.
from nose.tools import assert_equal, assert_almost_equal

In [None]:
def zeigen_1(datname):
    x_left, x_right, y_left, y_right = 15, 30, 30, 50 # Grenzen der Koordinatenachsen

    plt.axis([x_left, x_right, y_left, y_right]) # Achsen zeichnen
    plt.xticks(fontsize=15) # Unterteilung der x-Achse
    plt.yticks(fontsize=15) # Unterteilung der y-Achse
    plt.xlabel("Fu√ül√§nge", fontsize=18) # Beschriftung der x-Achse
    plt.ylabel("Schuhgr√∂√üe", fontsize=18) # Beschriftung der y-Achse

    # Die Datei wird eingelesen und die beiden Spalten als Listen in X und Y abgelegt. 
    # Die erste Zeile der Datei wird √ºberlesen
    X, Y = np.loadtxt (datname, skiprows=1, unpack=True)

    plt.plot (X, Y, "r.") # die Daten werden als rote Punkte dargestellt
    plt.show() # Die Graphik wird angezeigt

In [None]:
zeigen_1 ("../Daten/schuhe.txt")

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Man erkennt irgendwie einen Zusammenhang! Aber
1. Ist der Zusammenhang in einer Art *Formel* auszudr√ºcken?
2. Und kann auch der Computer diesen Zusammenhang entdecken?

### Vorhersage; ein erster Versuch

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Es scheint so, als ob ungef√§hr eine Gerade geeignet w√§re, den Zusammenhang auszudr√ºcken.

Also ein erster Versuch:
> Eine Gerade durch den Koordinatenursprung mit Steigung $m$ hat die Gradengleichung $y = m\cdot x$

Das k√∂nnen wir als Python-Funktion ausdr√ºcken (dabei kann der Parameter X sogar eine ganze Liste von Zahlen sein):

In [None]:
def vorhersage (X, m):
    return X*m

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Wir k√∂nnen ja den Wert von $m$ einmal raten und die Gerade anschie√üend einzeichnen (wir vergr√∂√üern dazu den Diagrammausschnitt so, dass der Koordinatenursprung sichtbar wird).

In [None]:
def zeigen_2 (datname, m = 0):
    x_left, x_right, y_left, y_right = -1, 30, -1, 50 # Grenzen der Koordinatenachsen

    plt.axis([x_left, x_right, y_left, y_right]) # Achsen zeichnen
    plt.xticks(fontsize=15) # Unterteilung der x-Achse
    plt.yticks(fontsize=15) # Unterteilung der y-Achse
    plt.xlabel("Fu√ül√§nge", fontsize=18) # Beschriftung der x-Achse
    plt.ylabel("Schuhgr√∂√üe", fontsize=18) # Beschriftung der y-Achse

    # Die Datei wird eingelesen und die beiden Spalten als Listen in X und Y abgelegt. 
    # Die erste Zeile der Datei wird √ºberlesen
    X, Y = np.loadtxt (datname, skiprows=1, unpack=True)

    plt.plot (X, Y, "r.") # die Daten werden als rote Punkte dargestellt
    plt.plot ([0, x_right], [0, vorhersage(x_right, m)], linewidth=1.0, color="b")
    plt.show() # Die Graphik wird angezeigt

<div style="background-color: lightblue; padding: 5px 20px 20px">

#### Aufgabe: 

Probier doch mit dem Wert von $m$ ein wenig herum!

In [None]:
zeigen_2 ("../Daten/schuhe.txt", m = 1.2)

### Fehler

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Nehmen wir jetzt einmal an, wir haben f√ºr m einen Wert von 1.2 getestet. Das scheint nicht gut zu passen! Doch kann man denn irgendwie messen, wie gro√ü der *Fehler* ist?

Der Fu√ü mit L√§nge 23.5 benutzte einen Schuh der Gr√∂√üe 37 (das ist die 3-te Zeile in der Tabelle). 

In [None]:
FUSS, SCHUH = np.loadtxt ("../Daten/schuhe.txt", skiprows=1, unpack=True)

In [None]:
FUSS[2] # Achtung: die Indizes beginnen mit 0

In [None]:
SCHUH[2]

<div style="background-color: lightblue; padding: 5px 20px 20px">

#### Aufgabe: 

Wie gro√ü ist die Vorhersage f√ºr den `FUSS[2]`? Gib den Wert in der folgenden Zelle ein.

In [None]:
vorher = 1000  # Hier deine L√∂sung eintragen; dann diese und die folgende Zelle ausf√ºhren.

In [None]:
try:
    vorher
except NameError:
    raise NameError("Es gibt keine Variable 'vorher'. Weise den Wert einer Variablen mit diesem Namen zu.")

error = False

try:
    assert_equal(vorher, 28.2)
except AssertionError:
    error = True

if not error:
    print("üëç Sehr gut!")
else:
    print("üëé Leider falsch.")

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Den korrekten Wert kann man nat√ºrlich auch vom Python-System errechnen lassen:

In [None]:
vorhersage (FUSS[2], 1.2)

<div style="background-color: lightblue; padding: 5px 20px 20px">


#### Aufgabe: 

Wie gro√ü ist jetzt der Fehler? Gib in der kommenden Zelle den richtigen Wert ein.

In [None]:
fehl = 1000 # Hier deine L√∂sung eintragen; dann diese und die folgende Zelle ausf√ºhren.

In [None]:
try:
    fehl
except NameError:
    raise NameError("Es gibt keine Variable 'y'. Weise den Wert einer Variablen mit diesem Namen zu.")

error = False

try:
    assert_equal(abs(fehl), 8.8)
except AssertionError:
    error = True

if not error:
    print("üëç Sehr gut!")
else:
    print("üëé Leider falsch.")

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Den korrekten Wert kann man nat√ºrlich auch vom Python-System errechnen lassen:

In [None]:
vorhersage (FUSS[2], 1.2) - SCHUH[2]

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Man kann sogar die Fehler aller Tabelleneintr√§ge auflisten:

In [None]:
print (vorhersage (FUSS, 1.2) - SCHUH)

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Alle Fehler k√∂nnten wir jetzt aufsummieren, um sozusagen den Gesamtfehler zu ermitteln:

In [None]:
sum (vorhersage (FUSS, 1.2) - SCHUH)

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Jedoch ist es dabei problematisch, den Fehler mit Hilfe der Differenz zu messen. Denn vielleicht sind einige der Fehler positiv, andere negativ, so dass sie sich irgendwie aufheben werden und wir so meinen, einen sehr kleinen Fehler zu machen.

Man k√∂nnte jetzt den Absolutwert der Differenz als Fehler benutzen, doch hat es sich als sinnvoll erwiesen, die Differenzen zu quadrieren (dann ergibt sich ja auch immer ein nicht-negativer Wert). 

Also machen wir alle Rechnungen erneut:

In [None]:
(vorhersage (FUSS[2], 1.2) - SCHUH[2])**2

In [None]:
print ((vorhersage (FUSS, 1.2) - SCHUH)**2)

In [None]:
sum ((vorhersage (FUSS, 1.2) - SCHUH)**2)

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Und statt der Summe aller Fehler k√∂nnten wir auch den Durchschnittlichen Fehler nutzen, um von der Anzahl der Tabelleneintr√§ge unabh√§ngig zu sein:

In [None]:
np.average ((vorhersage (FUSS, 1.2) - SCHUH)**2)

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Das k√∂nnten wir in einer Python-Definition ausdr√ºcken:

In [None]:
def fehler (X, Y, m):
    return np.average ((vorhersage (X, m) - Y)**2)

### Training

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

Die Idee besteht jetzt darin, den Wert von m so zu ver√§ndern, dass der Fehler m√∂glichst gering wird. 

Dazu beginnt man mit einem willk√ºrlichen Wert f√ºr m und ver√§ndert diesen Wert schrittweise nach oben bzw. unten, bis eine Ver√§nderung keinen Fortschritt mehr bringt.

Man sagt dann, dass man ***trainiert***.

In [None]:
def training (X, Y, iterationen, lernrate, anzeige = False):
    m = 0
    for i in range(iterationen):
        aktuellerFehler = fehler(X, Y, m)
        if anzeige:
            print("w: %.3f =>Iteration: %4d => Loss: %.6f" % (m, i, aktuellerFehler))

        if fehler (X, Y, m + lernrate) < aktuellerFehler:
            m += lernrate
        elif fehler (X, Y, m - lernrate) < aktuellerFehler:
            m -= lernrate
    return m

In [None]:
steigung = training (FUSS, SCHUH, iterationen = 20, lernrate = 0.01, anzeige = True)
print ("Vermutete Steigung =", steigung)

<div style="background-color: lightblue; padding: 5px 20px 20px">


#### Aufgabe: 

F√ºhre in der folgenden Zelle die Trainingsphase mit mehr Iterationen und/oder mit anderen Lernraten aus und beobachte das Ergebnis. 

**Tipp:** 
   
Wenn die Test-Ausgabe bei vielen Iterationen st√∂rt, kannst du den 3-ten Parameter auf den Wert `False` setzen oder auch ganz weglassen!

In [None]:
steigung = training (FUSS, SCHUH, iterationen = 20, lernrate = 0.01, anzeige = True)
print ("Vermutete Steigung =", steigung)

In [None]:
import seaborn as sns

In [None]:
def zeigen_3 (datname, iterationen, lernrate):
    X, Y = np.loadtxt (datname, skiprows=1, unpack=True)
    m = training (X, Y, iterationen, lernrate)
    sns.set()
    plt.plot(X, Y, "r.")
    plt.xticks(fontsize=15)
    plt.yticks(fontsize=15)
    plt.xlabel("Fu√ül√§nge (F)", fontsize=30)
    plt.ylabel("Schuhgr√∂√üe (S)", fontsize=30)
    x_left, x_right, y_left, y_right = 0, 30, 0, 50
    plt.axis([x_left, x_right, y_left, y_right])
    wert = vorhersage(x_right, m)
    plt.plot([0, x_right], [0, wert], linewidth=1.0, color="k")
    plt.show()
    print("Der Zusammenhang ist etwa S = %.3f * F" % m)


In [None]:
zeigen_3 ("../Daten/schuhe.txt", iterationen = 1000, lernrate = 0.01)

### Wie geht es weiter?

<div style="background-color: Cornsilk; padding: 5px 20px 20px">

In Wirklichkeit ist der vorhergesagte Wert ein wenig zu klein (das sieht man nicht so deutlich); in der Definition der europ√§ischen Schuhgr√∂√üen muss man zu der Fu√ül√§nge noch einige Millimeter zuf√ºgen, damit der Fu√ü Platz hat, sich zu bewegen.

Aber das f√§llt ja hier kaum auf!

Doch es gibt auch Datenmengen, bei denen zwar eine Gerade als Vorhersage dient, die jedoch nicht durch den Koordinatenursprung verl√§uft. Das wird im folgenden Kapitel er√∂rtert.
