# OLS en Gradient Descent

In dit labo passen we verschillende methoden toe om lineaire regressie parameters te schatten:
1. De _closed form_ OLS oplossing
2. Vergelijking met scikit-learn, NumPy en statsmodels OLS implementaties
3. Gradient berekening met PyTorch autograd
4. Implementatie van Stochastic Gradient Descent

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns
import statsmodels.api as sm
import torch
from sklearn.datasets import fetch_california_housing
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

rng = np.random.default_rng(67)
torch.manual_seed(67)

plt.style.use("seaborn-v0_8-darkgrid")
sns.set_palette("husl")

## Dataset [California Housing](https://scikit-learn.org/stable/datasets/real_world.html#california-housing-dataset) 🌴

In [None]:
housing = fetch_california_housing(as_frame=True)
df = housing.frame

print(f"Dataset shape: {df.shape}")
print(f"\nFeatures: {housing.feature_names}")
print("\nFirst rows:")
display(df.head())

print("\nBasic statistics:")
display(df.describe())

## Design matrix

We werken met slechts twee predictor-variabelen:
1. `MedInc`: _median income in block group_
2. `AveRooms`: _average number of rooms per household_   
  
De target variabele is `MedHouseVal`: _median house value for California districts, expressed in hundreds of thousands of dollars ($100,000)_

## ✍️
Hoe ziet de algemene matrix vorm van het model eruit?

## ✍️

Hoe ziet de parameter tensor er specifiek uit?

## ✍️

Hoe die de design/feature matrix er specifiek uit?

## ✍️

Hoe implementeren we deze tensors in Python?

## Conditienummer en Correlatie

## ✍️
Hoe is het gesteld met het conditienummer van de design matrix en de multicollineariteit bij de predictoren?

In [None]:
# Calculate condition number

In [None]:
# Correlation analysis

## Manuele OLS

## ✍️

Hoe implementeren we de analytische oplossing in Python?

## Scikit-learn OLS

## ✍️

Hoe implementeren we OLS met scikit-learn?

In [None]:
# Scikit-learn LinearRegression

## NumPy OLS

## ✍️

Hoe implementeren we OLS met NumPy?

In [None]:
# NumPy least squares solution

## Statsmodels OLS

## ✍️

Hoe implementeren we OLS met statsmodels?

In [None]:
# Statsmodels OLS

## Automatische differentiatie

PyTorch's automatische differentiatie `autograd` berekent gradiënten automatisch via de chain rule. De bibliotheek is voornamelijk bedoeld voor gebruik bij neurale netwerken, maar hier kunnen we er al een eerste keer gebruik van maken om _gradient descent_ te implementeren voor ons lineaire regressiemodel.

Hieronder eerst een demonstratie met een eenvoudig voorbeeld.

In [None]:
# Simple example: compute gradient of f(x) = x^2 + 3x + 5
print("Example: f(x) = x² + 3x + 5")
print("Analytical gradient: f'(x) = 2x + 3")

x = torch.tensor(2.0, requires_grad=True)
print(f"\nEvaluate at x = {x.item()}")

# Forward pass
f = x**2 + 3 * x + 5
print(f"f(x) = {f.item()}")

# Backward pass (compute gradient)
f.backward()
print(f"Computed gradient f'(x) = {x.grad.item()}")
print(f"Analytical gradient at x=2: 2(2) + 3 = {2 * 2 + 3}")

### Hoe werkt automatische differentiatie?

In het bovenstaande voorbeeld zien we hoe PyTorch de gradiënt automatisch berekent:

1. **Forward pass**: We definiëren de functie `f = x² + 3x + 5` en PyTorch houdt alle operaties bij in een _computational graph_.

2. **Backward pass**: Bij het aanroepen van `f.backward()` past PyTorch de _chain rule_ toe om de gradiënt te berekenen. Voor elke operatie in de graph kent PyTorch de afgeleide:
   - Afgeleide van x²: 2x
   - Afgeleide van 3x: 3
   - Afgeleide van constante: 0

3. **Resultaat**: De gradiënt wordt opgeslagen in `x.grad`. Bij x=2 vinden we f'(2) = 2(2) + 3 = 7.

Dit mechanisme is fundamenteel voor gradient descent: we kunnen complexe functies definiëren en PyTorch berekent automatisch de gradiënten die nodig zijn om de parameters te optimaliseren.

## ✍️

Hoe implementeren we automatische differentiatie voor:

$$
f(x, y) = x^2y + 3xy^2
$$

## Gradient Descent met `autograd`

## ✍️