# Logistische regressie met _gradient descent_

In deze lab-sessie passen we logistische regressie met gradient descent toe op de **Iris dataset**. We bouwen een binaire classifier die onderscheid maakt tussen twee soorten irissen op basis van hun bloemeigenschappen.

## Leerdoelen
- Logistische regressie implementeren met gradient descent
- Binary cross-entropy loss berekenen en minimaliseren

## Extras
- Model performance evalueren
- Decision boundaries visualiseren

In [55]:
from sklearn.datasets import load_iris


## 1. Data Loading en Exploratie

## ✍️

De Iris dataset bevat metingen van 150 iris bloemen van 3 verschillende soorten:
- **Setosa**
- **Versicolor** 
- **Virginica**

Voor elk bloem zijn er 4 features gemeten (in cm):
- Sepal length (kelkblad lengte)
- Sepal width (kelkblad breedte)
- Petal length (bloemblad lengte)
- Petal width (bloemblad breedte)

⚠️ Voor deze oefening maken we een **binaire classificatie**: we onderscheiden alleen tussen **Versicolor** (klasse 0) en **Virginica** (klasse 1).

In [56]:
# Load the Iris dataset
iris = load_iris()

## 2. Data Voorbereiding

## ✍️

We splitsen de data in:
- **Training set** (80%): gebruikt om het model te trainen
- **Test set** (20%): gebruikt om het model te evalueren

We gebruiken **feature scaling** (standaardisatie) om ervoor te zorgen dat alle features dezelfde schaal hebben. Dit helpt gradient descent sneller convergeren.

## 3. Logistische Regressie Implementatie

## ✍️

We implementeren logistische regressie met gradient descent zoals gezien in de cursus:

### Model
$$
\pmb{\hat{y}} = \sigma(\pmb{X}\pmb{b}) = \frac{1}{1 + e^{-\pmb{X}\pmb{b}}}
$$

### Binary Cross-Entropy Loss
$$
\mathcal{L}_{BCE}(\pmb{b}) = -\frac{1}{n} \sum_{i=1}^{n} \left[ y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right]
$$

### Gradiënt
$$
\nabla \mathcal{L}_{BCE} = \frac{1}{n} \pmb{X}^T(\pmb{\hat{y}} - \pmb{y})
$$

### Gradient Descent Update
$$
\pmb{b}^{k+1} = \pmb{b}^k - \lambda \nabla \mathcal{L}_{BCE}(\pmb{b}^k)
$$

## 4. Training met Gradient Descent

## ✍️

Nu trainen we het model met gradient descent. We houden de loss en accuracy bij voor zowel de training als test set.

## 5. Visualisatie van Training Proces

## ✍️

We visualiseren hoe de loss en accuracy evolueren tijdens het training proces.

## 6. Model Evaluatie en Predictions

## 🎯

Laten we kijken naar de voorspellingen van ons model en hoe goed het presteert.

## 7. Decision Boundary Visualisatie

## 🎯

We visualiseren de decision boundary van ons model voor twee features tegelijk. We gebruiken petal length en petal width omdat deze features het best discrimineren tussen de twee soorten.

## 8. Interactieve Visualisatie met Plotly

## 🎯

Laten we een interactieve 3D visualisatie maken om te zien hoe de voorspelde waarschijnlijkheid varieert in de feature space.