# Gradient Descent

Gradient Descent ist ein Optimierungsalgorithmus, der in vielen maschinellen Lern- und Optimierungsproblemen eingesetzt wird. Seine Hauptaufgabe besteht darin, ein lokales Minimum einer Funktion zu finden, typischerweise in einem mehrdimensionalen Raum.

### Grundidee:

Stell dir vor, du stehst auf einem Berggipfel und möchtest den tiefsten Punkt im Tal erreichen, ohne eine Karte zu haben. Du kannst jedoch spüren, in welche Richtung der Boden am steilsten abfällt. Du möchtest den Weg finden, der dich am schnellsten ins Tal führt. Gradient Descent ist wie das Absteigen des Berges, indem du den steilsten Abstiegspfad nimmst.

In [None]:
%pip install numpy

## Schritte des Gradient Descent:

1. Initialisierung

In [None]:
import numpy as np

# Generate some random data points for demonstration
np.random.seed(0)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)

# Number of iterations and learning rate
iterations = 1000
learning_rate = 0.1

# Initial values for the slope (theta0) and intercept (theta1)
theta0 = np.random.randn()
theta1 = np.random.randn()

2. Berechnung des Gradienten

Der Gradient ist ein Vektor, der die Richtung des steilsten Anstiegs (anstelle des Abstiegs) in einem mehrdimensionalen Raum angibt. In einfachen Worten ist der Gradient eine Liste von Ableitungen, die für jede Variable angeben, wie stark die Funktion in diese Richtung steigt. Der Gradient wird am aktuellen Standpunkt berechnet.

In [None]:
# Calculate the predicted values
y_pred = theta0 + theta1 * X
    
# Calculate the gradients (partial derivatives) with respect to the cost function
gradient_theta0 = np.sum(y_pred - y)
gradient_theta1 = np.sum((y_pred - y) * X)

3. Bewegung in die Abstiegsrichtung & Aktualisierung

In [None]:
 # Update the parameters using the gradients and learning rate
theta0 = theta0 - learning_rate * gradient_theta0
theta1 = theta1 - learning_rate * gradient_theta1

5. Wiederholung --> Iterativer Algorithmus:

In [None]:
for iteration in range(iterations):
    # Calculate the predicted values
    y_pred = theta0 + theta1 * X
    
    # Calculate the gradients (partial derivatives) with respect to the cost function
    gradient_theta0 = np.sum(y_pred - y)
    gradient_theta1 = np.sum((y_pred - y) * X)
    
    # Update the parameters using the gradients and learning rate
    theta0 = theta0 - learning_rate * gradient_theta0
    theta1 = theta1 - learning_rate * gradient_theta1

print("Final theta0:", theta0)
print("Final theta1:", theta1)
