In [None]:
import numpy as np
import matplotlib
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

from lineare_regression import linear_hypothesis_vec, cost_function_vec, feature_scaling, compute_new_theta_vec, gradient_descent_multi

# interactive plots \o/
%matplotlib notebook

In [None]:
# 1) Erstellen Sie zuerst zum Testen Ihrer Lösung künstliche Datenwerte für
# zwei Merkmale (Features): 
# X soll dabei eine Datenmatrix mit zwei Spalten sein, wobei die Werte zufällig aus
# einer Gleichverteilung (konstante Wahrscheinlichkeitsdichte in einem Intervall) gezogen werden.


def generate_x_values(num_of_features: int, interval_min: float, interval_max: float, sample_size: int):
    return np.random.uniform(interval_min, interval_max, (sample_size, num_of_features))


x_values = generate_x_values(num_of_features=2, interval_min=0, interval_max=5, sample_size=100)

print("Shape of the generated data: {}".format(x_values.shape))
print()
print("Generated Data:")
print(x_values)


In [None]:
# 2) Implementieren Sie die Hypothese (lineares Modell) als Python Funktion:
# linear_hypothesis(theta)
# 
# Die Pythonfunktion soll dabei eine Funktion zurückgeben:
# >> theta = np.array([1.1, 2.0, -.9]) 
# >> h = linear_hypothesis(theta) 
# >> print h(X) 
# array([ -0.99896965, 20.71147926, ....

theta = np.array([1.1, 2.0, -.9]) 
h = linear_hypothesis_vec(theta)

print("Result of h with theta ({}): \n{}".format(theta, h(x_values)))

In [None]:
# 3) 
# a) Nutzen Sie die Funktion linear_hypothesis(theta) zum Generieren 
# künstlicher y-Werte (Zielwerte) für Ihre Merkmalsvektoren (Zeilen von X). 
# Addieren Sie zusätzich ein gaussches Rauschen auf die einzelnen y-Werte.

# noise params

mean = 0
std = 2

y_values = h(x_values)
print("y_values without noise: \n{}".format(y_values))
print()
y_values = np.add(y_values, np.random.normal(loc=mean, scale=std, size=y_values.shape))
print("y_values with noise: \n{}".format(y_values))
print()

# b) Stellen Sie die X1-X2-Y Werte in einem 3D Plot dar.
# siehe: http://matplotlib.org/mpl_toolkits/mplot3d/tutorial.html

fig = plt.figure()
ax = fig.add_subplot(111, projection="3d")  # type: Axes3D
ax.scatter(x_values[:, 0], x_values[:, 1], y_values)
ax.set_xlabel("X1")
ax.set_ylabel("X2")
ax.set_zlabel("Y")
plt.show()

# c) Implementieren Sie das Feature Scaling um neue x' Werte zu berechnen

x_scaled = feature_scaling(x_values)
print("x_values without scaling: \n{}".format(x_values))
print()
print("scaled x_values: \n{}".format(x_scaled))
print()
print("x_scaled mean: {}".format(np.mean(x_scaled)))
print("x_scaled std: {}".format(np.std(x_scaled)))


In [None]:
# 4) Implementieren Sie die Kostenfunktion J als Python Funktion:
# cost_function(x, y)
# Die Pythonfunktion soll dabei eine Funktion zurückgeben, die
# die denParametervektor theta aufnimmt.
# 
# >> j = cost_function(X, y) 
# >> print j(theta)
# 41.20 # Wert abhaengig von X und y

j = cost_function_vec(linear_hypothesis_vec, x_scaled, y_values) 
print("costs with current theta ({}): {}".format(theta, j(theta)))


In [None]:
# 5) Implementieren Sie das Gradientenabstiegsverfahren unter Benutzung der Kostenfunktion und der linearen Hypothese.
# 5a) Schreiben Sie eine Funktion die die Update Rules anwendet zur Berechnung der neuen theta-Werte:
# theta = compute_new_theta(x, y, theta, alpha)

new_theta = compute_new_theta_vec(h, x_scaled, y_values, theta, 0.001)
print("thetas before first update: {}".format(theta))
print("thetas after first update: {}".format(new_theta))
print()

# 5b) Wählen Sie Startwerte in der Umgebung des Miniums der Kostenfunktion für theta. 
# Wenden Sie iterativ die compute_new_theta Funktion an und finden Sie so ein Theta mit niedrigen Kosten.
# Kapseln Sie dies in eine Funktion:
# gradient_descent(alpha, theta, nb_iterations, X, y)

cost_y, last_thetas = gradient_descent_multi(x_scaled, y_values, theta, 0.001, iterations=10000)

# 5c) Plotten Sie den Fortschritt (Verringerung der Kosten über den Iterationen) für 5b

cost_x = np.arange(0, len(cost_y))

plt.figure()
plt.title("learning progress")
plt.xlabel("iterations")
plt.ylabel("costs")
plt.plot(cost_x, cost_y)
plt.show()

print("last cost value: {}".format(cost_y[-1]))


In [None]:
# 6) Stellen Sie die gefundene Hyperebene in einem 3D Plot zusammen mit den Daten dar

plt.ion()
fig = plt.figure()
ax = fig.add_subplot(111, projection="3d")

x_1 = x_values[:, 0]
x_2 = x_values[:, 1]

ax.scatter(x_1, x_2, y_values)

x_meshgrid = np.linspace(x_1.min(), x_1.max(), 10)
y_meshgrid = np.linspace(x_2.min(), x_2.max(), 10)
x_meshgrid, y_meshgrid = np.meshgrid(x_meshgrid, y_meshgrid)
z_meshgrid = theta[0] + theta[1] * x_meshgrid + theta[2] * y_meshgrid
ax.plot_surface(x_meshgrid, y_meshgrid, z_meshgrid, alpha=0.5, color="r")

ax.set_xlabel("X1")
ax.set_ylabel("X2")
ax.set_zlabel("Y")
plt.show()
