# ✍️ Machine Learning Demo: Handgeschreven cijfers herkennen (MNIST)

In dit project gaan we een machine learning-model bouwen dat **handgeschreven cijfers (0 t/m 9)** kan herkennen. We gebruiken hiervoor de bekende **MNIST-dataset**, een van de meest gebruikte datasets in computer vision.

## 📦 Stap 1: Dataset laden en verkennen
We gebruiken `sklearn.datasets` om de **MNIST digits dataset** te laden. Deze dataset bevat 1.797 zwart-wit afbeeldingen van 8x8 pixels met cijfers van 0 tot 9.

We bekijken eerst de vorm en inhoud van de data.

In [None]:
from sklearn.datasets import load_digits
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# Dataset laden
digits = load_digits()
print("Aantal voorbeelden:", len(digits.images))
print("Vorm van één afbeelding:", digits.images[0].shape)

# Eerste cijfer bekijken
plt.imshow(digits.images[0], cmap='gray')
plt.title(f"Label: {digits.target[0]}")
plt.axis('off')
plt.show()

## 🧹 Stap 2: Data voorbereiden

Voor machine learning moeten we 2D-afbeeldingen omzetten naar platte rijen (1D). Elke afbeelding van 8x8 pixels wordt dus een vector van 64 getallen.
We splitsen ook de data in een trainingsset en een testset.

In [None]:
from sklearn.model_selection import train_test_split

# X = platte pixels, y = cijfers
X = digits.data  # shape: (1797, 64)
y = digits.target

# Splitsen in 80% train, 20% test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
print("Trainingsdata:", X_train.shape)
print("Testdata:", X_test.shape)

## 🧠 Stap 3: Model trainen (Support Vector Machine)

We gebruiken hier een Support Vector Classifier (SVC), een klassiek ML-model dat goed werkt bij beeldherkenning. We trainen het model op de trainingsset.

In [None]:
from sklearn.svm import SVC

model = SVC(gamma=0.001)  # gamma = complexiteit van het model
model.fit(X_train, y_train)

print("Model getraind!")

## ✅ Stap 4: Evalueren van het model

We voorspellen op de testset en vergelijken de voorspellingen met de echte labels.
We gebruiken een classificatierapport en bekijken ook een paar voorbeeldafbeeldingen.

In [None]:
from sklearn.metrics import classification_report, confusion_matrix

y_pred = model.predict(X_test)

# Rapport
print(classification_report(y_test, y_pred))

## 🖼️ Bonus: Visualiseer een paar voorspellingen
We tonen enkele cijfers uit de testset, samen met de voorspelling van het model.

In [None]:
fig, axes = plt.subplots(2, 5, figsize=(10, 5))
for i, ax in enumerate(axes.flat):
    ax.imshow(X_test[i].reshape(8, 8), cmap='gray')
    ax.set_title(f"Pred: {y_pred[i]}\nTrue: {y_test[i]}")
    ax.axis('off')
plt.tight_layout()
plt.show()