# MLiP Regression & Gradientenverfahren

#### In diesem Notebook soll das Gradientenverfahren am Beispiel der Linearen Regression veranschaulicht werden.

### 1. Datensatz importieren

In [None]:
# Importiere benötigte Bibliotheken
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.cm as cm
%matplotlib inline

In [None]:
## Daten erfassen
# Importiere Datensatz
df = pd.read_excel('Daten - Gradientenverfahren.xlsx')
print('Daten erfolgreich eingelesen')

In [None]:
## Daten erkunden
# Ausgabe Graph
plt.figure(figsize=(12, 6))
plt.plot(df['X'], df['Y'], 'o') 
plt.xlabel('X-Wert')
plt.ylabel('Y-Wert')
plt.title('Datensatz'); 
plt.show()

### 2. Setze Start-Gerade und wähle Lernrate

TODO: 
- Stell die Lernrate für die Regression ein (Werte zwischen 0 und 1, z.B. 0.02)

AUSGABE:
- Graph: Daten und Start-Regressionsgerade

In [None]:
# Lernrate
learn_rate = 0.01

# Setzte zufällige Regressionsgerade
w_0 = 2.0
w_1 = 1.0
iteration = 0
df['Y_pred'] =  w_0 + df['X'] * w_1
results = pd.DataFrame(columns=['Schritt', 'RMSE', 'Regressionsgerade']); 

# Ausgabe Graph
plt.figure(figsize=(12,6))
plt.plot(df['X'], df['Y'], 'o', df['X'], df['Y_pred'], '-o')
plt.xlabel('X-Wert')
plt.ylabel('Y-Wert')
plt.title('Datensatz mit Startgerade')
plt.legend(['Daten', 'Regressionsgerade'])
plt.show()

### 3. Schrittweise Optimierung der Geraden (Gradientenverfahren)

TODO:
- Mehrmaliges Ausführen des Code-Blocks 
- Zum Einstellen einer neuen Lernrate ändere diese im 2. Code-Block und führe diesen 1x aus, das setzt sowohl die Tabelle sowie die Graphen zurück

AUSGABE:
- Tabelle mit Schrittanzahl, RMSE und Regressiongeraden
- Graph aller Regressionsgeraden

Nach jedem Ausführen wird die Tabelle sowie der Graph erweitert (aktuelle Gerade und Fehler), hier können Sie sowohl visuell als auch anhand des RMSE den Verlauf betrachten. Führe die Schrittweise Regression für verschiedene Lernraten beginne mit 0,02) durch und bewerte die jeweilige Lernrate.

In [None]:
# Start Schrittweise Regression
Y_pred_name = "Y_pred_" + str(iteration)
Y_r_name = "Y_r_" + str(iteration)
df[Y_pred_name] = w_0 + df['X'] * w_1
df[Y_r_name] = df['Y'] - df[Y_pred_name]

# Erstelle Tabelle mit Schritt, Fehler und Regressionsgerade
DS_3 = pd.DataFrame({'Schritt': [iteration], 'RMSE': [(((df[Y_r_name])**2).mean())**(1.0/2.0)], 'Regressionsgerade': [str('y = ' + str("%.2f" % w_0) + ' + ' + str("%.2f" % w_1) + ' * x')]})
results = results.append(DS_3)

# Berechne Gradienten
gradient_w0 = -df[Y_r_name].mean() * 2
gradient_w1 = (-df[Y_r_name] * df['X']).mean() * 2 

# Berechne neue Parameter der Regressionsgeraden
w_0= w_0 - learn_rate * gradient_w0
w_1 = w_1 - learn_rate * gradient_w1
R_X_1, R_X_2, R_X_3, R_X_4, R_X_5 = [1, 1], [2, 2], [3, 3], [4, 4], [5, 5]
R_Y_1 = [df['Y'][0],df[Y_pred_name][0]]
R_Y_2 = [df['Y'][1],df[Y_pred_name][1]]
R_Y_3 = [df['Y'][2],df[Y_pred_name][2]]
R_Y_4 = [df['Y'][3],df[Y_pred_name][3]]
R_Y_5 = [df['Y'][4],df[Y_pred_name][4]]

%matplotlib inline
# Ausgabe Graph und Tabelle
plt.figure(figsize=(17,10))
plt.plot(df['X'], df['Y'], marker='o', markersize=12, linewidth=0)
plt.plot(df['X'], df[Y_pred_name], marker='o', markersize=12, linewidth=4)
plt.plot(R_X_1, R_Y_1, 'k--', R_X_2, R_Y_2, 'k--', R_X_3, R_Y_3, 'k--', R_X_4, R_Y_4, 'k--', R_X_5, R_Y_5, 'k--')
for i in range(iteration):
    Y_pred_name = "Y_pred_" + str(i)
    X = [1,5]
    Y = [df[Y_pred_name][0], df[Y_pred_name][4]]
    plt.plot(X, Y, 'k-', alpha=0.3)     
    
plt.xlabel('X-Wert')
plt.ylabel('Y-Wert')
plt.title('Schrittweise lineare Regression')
plt.xlim(0.5, 5.5)
plt.legend(['Datensatz', 'aktuelle Regressionsgerade', 'Abweichung: Gerade - Reale Daten'], loc='upper left')
print("\n")
print(results.to_string(index=False))
plt.show()
iteration += 1

### 4. Visualisierung der Fehlerfläche und deren Minimierung (Gradientenverfahren)

TODO:
- Stelle nacheinander die Lernraten (0.08, 0.03, 0.01, 0.001, 0.084) ein 
- Stelle die Anzahl der durchzuführenden Schritte ein (mindestens 10 & maximal 1000) 

AUSGABE:
- RMSE-Werte für Begin, Mitte und Ende
- Graph aller Koeffizienten über der Fehlerfläche (RMSE)

HINWEIS:
- Mitunter muss der Code-Block zweimal ausgeführt werden, damit die Grafik korrekt angezeigt wird.

In [None]:
# 4. Code-Block

# Lernrate und Schritte
learn_rate = 0.08 # TODO
iterations = 1000   # TODO

# Startgerade
w_0s = [2]
w_1s =  [1]
rmses = []
x0 = []
x1 = []
y0 = [] 
y1 = [] 
z = []
df_2 = df.copy()

# Berechne Geraden für Iterations
for nr_iteration in range(iterations):
    # Speichere Fehler
    df_2['Y_diff'] = df_2['Y'] - (df_2['X'] * w_1s[-1] + w_0s[-1])
    rmses.append((((df_2['Y_diff'])**2).mean()) ** (1.0/2.0))
    # Speichere Gerade
    x0.append(1); x1.append(5)
    y0.append(1 * w_1s[-1] + w_0s[-1])
    y1.append(5 * w_1s[-1] + w_0s[-1])
    # Berechne neue Koeffizienten
    gradient_w0 = -df_2['Y_diff'].mean() * 2
    gradient_w1 = (-df_2['Y_diff'] * df_2['X']).mean() * 2 
    w_0s.append(w_0s[-1] - learn_rate * gradient_w0)
    w_1s.append(w_1s[-1] - learn_rate * gradient_w1)
    
# Berechne Fehlerfläche 
# Berechne Grenzen
w0_max  = max(w_0s)
w0_min = min(w_0s)
w0_dif = (max(w_0s)-min(w_0s)) * 0.2
w1_max = max(w_1s)
w1_min = min(w_1s)
w1_dif = (max(w_1s)-min(w_1s)) * 0.2

# Berechne Grid
w0_L = np.linspace(w0_min-w0_dif, w0_max+w0_dif, 50)
w1_L = np.linspace(w1_min-w1_dif, w1_max+w1_dif, 50)
X,Y = np.meshgrid(w0_L, w1_L)

# Berechne Fehler je Gridpunkt
for point in range(50*50):
    df_2['Y_diff'] = df_2['Y'] - (df_2['X'] * Y.ravel()[point] + X.ravel()[point])
    z.append((((df_2['Y_diff'])**2).mean()) ** (1.0/2.0))
Z = np.asarray(z).reshape(50, 50)

# Ausgabe
print('\nRMSE (Start): \t' + str("%.5f" % rmses[0]) + '\nRMSE (Ende): \t' + str("%.5f" % rmses[nr_iteration-1]))
%matplotlib notebook

from mpl_toolkits.mplot3d import Axes3D
c = np.linspace(0, 1, len(rmses))
fig = plt.figure(figsize=(16, 10))
ax = fig.add_subplot(111, projection='3d')
plt.title("Fehlerfläche (RMSE) über w_0 & w_1")
plt.xlabel('w_0'); plt.ylabel('w_1')
ax.scatter(w_0s[:-1], w_1s[:-1], 0, '-o', s=40, color = '0.75')
surf = ax.plot_surface(X, Y, Z, cmap=cm.viridis, alpha=0.5, antialiased=False, rstride=3, cstride=3)
ax.plot(w_0s[:-1], w_1s[:-1], rmses, 'k-o', markersize=7)
fig.colorbar(surf, shrink=0.5, aspect=5) 

# Winkel für Ansicht (Höhenwinkel, Seitenwinkel)
ax.view_init(30, 150)
plt.show()

### Lineare Regression automatisch

In [None]:
from sklearn import linear_model

X = df[['X']]
y = df[['Y']]
# Erstellen des Modells
linear_mdl = linear_model.LinearRegression()
#Trainieren des Modells
linear_mdl = linear_mdl.fit(X, y)

X_grid = np.linspace(1, 5, 100).reshape(100,1)
y_grid = linear_mdl.predict(X_grid)

%matplotlib inline
# Ausgabe Graph
plt.figure(figsize=(12,6))
plt.plot(df['X'], df['Y'], 'o')
plt.plot(X_grid, y_grid) 
plt.plot(X_grid, w_0 + w_1 * X_grid, 'k')
plt.xlabel('X-Wert')
plt.ylabel('Y-Wert')
plt.title('Datensatz mit Startgerade')
plt.legend(['Daten', 'Regressionsgerade', 'eigene Regressionsgerade'])
plt.show()

In [None]:
# Ergebnis der implementierten Linearen Regression
print('w_0: ' + str(linear_mdl.intercept_[0]))
print('w_1: ' + str(linear_mdl.coef_[0][0]))