
Beispiel einer linearen Regression mit scikit-learn


In [None]:
#
# Führe diese Zelle aus, um die benötigten Pakete zu installieren.
# Falls du die Pakete bereits installiert hast, kannst du diese Zelle überspringen.
#
%pip install numpy
%pip install matplotlib
%pip install scikit-learn

In [None]:
import random
import numpy as np
from sklearn import linear_model
from sklearn.metrics import mean_squared_error, r2_score
from matplotlib import pyplot as plt

In [None]:
# Generate random hash
hash = random.getrandbits(16)
print("Hash: ", hash)

In [None]:
# um die Reproduzierbarkeit der Ergebnisse zu gewährleisten, setzen wir random.seed auf eine festen Wert, z.B. 7n
np.random.seed(7)

In [None]:
# Der Array für die x-Werte des Datensatzes weren generiert
x = np.arange(-500,500)

In [None]:
# Der zu addierende Zufallswert wird in einem Streifen von ±15 um die Werte der Funktion y = .5 * x + 11 
# und die y-Werte des Datensatzes werden generiert.
delta = np.random.uniform(-15 , 15, x.size)
y = .5 * x + 11 + delta
print("X === ", x)
np.set_printoptions(precision=3)
print("RES == ", y)

In [None]:
# Das Dataset wird im Verhältnis von 80:20 in ein Trainingset 
# und ein Teset aufgeteilt
x_train = x[:-200].reshape( (800, 1) )
x_test = x[-200:].reshape( (200, 1) )
y_train = y[:-200]
y_test = y[-200:]

In [None]:
# Ein Instanz der Klasse für lineare Regression wird erzeugt
model = linear_model.LinearRegression()

In [None]:
# Das Modell wird mit den Trainsdaten (800 Einträgen) trainiert ... 
model.fit(x_train, y_train)

In [None]:
print("W:", model.coef_)
print("b:", model.intercept_)

In [None]:
# ... und die Koeffizienten der linearen Regression ausgegeben.
print('Coefficient: \n', model.coef_)

In [None]:
# Das trainierte Modell wird nun mit den Testdaten getestet. 
# Die zu den x-Werten des Testsets korrespondierenden Werte werden 
# mit dem Modell berechnet.
y_pred = model.predict(x_test)

In [None]:
# Die Metriken zu den testwerten können nun ausgegeben werden.
print("Mean squared error: %.2f"
      % mean_squared_error(y_test, y_pred))
print('r_2 statistic: %.2f' % r2_score(y_test, y_pred))

In [None]:
# Die Ergebnisse werden visualisiert. 
# durch Ploten des Testsets
plt.scatter(x_test, y_test)

In [None]:
# und Ploten der durch lienare Regression gelerneten Funktion
plt.scatter(x_test, y_test)
plt.plot(x_test, y_pred, color='red')
plt.show()