# TP: Application des SVM pour la prédiction du diabète

Ce TP vise à appliquer les Support Vector Machines (SVM) sur le jeu de données diabetes de scikit-learn pour prédire la progression de la maladie.

In [None]:
# Importation des bibliothèques nécessaires
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_diabetes
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVR
from sklearn.metrics import mean_squared_error, r2_score

In [None]:
# Chargement et préparation des données
diabetes = load_diabetes()
X = diabetes.data
y = diabetes.target

# Division en ensembles d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Standardisation des données
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

print(f"Dimensions des données d'entraînement: {X_train.shape}")
print(f"Dimensions des données de test: {X_test.shape}")

In [None]:
# Entraînement du modèle SVM avec différents noyaux
kernels = ['linear', 'poly', 'rbf']
svr_models = {}
results = {}

for kernel in kernels:
    # Création et entraînement du modèle
    svr = SVR(kernel=kernel)
    svr.fit(X_train_scaled, y_train)
    svr_models[kernel] = svr
    
    # Prédictions
    y_pred = svr.predict(X_test_scaled)
    
    # Évaluation
    mse = mean_squared_error(y_test, y_pred)
    r2 = r2_score(y_test, y_pred)
    results[kernel] = {'MSE': mse, 'R²': r2}
    
    print(f"Noyau {kernel}:")
    print(f"  MSE: {mse:.2f}")
    print(f"  R²: {r2:.4f}\n")

In [None]:
# Visualisation des résultats
best_kernel = min(results, key=lambda k: results[k]['MSE'])
best_model = svr_models[best_kernel]
y_pred_best = best_model.predict(X_test_scaled)

plt.figure(figsize=(10, 6))
plt.scatter(y_test, y_pred_best, alpha=0.7)
plt.plot([y_test.min(), y_test.max()], [y_test.min(), y_test.max()], 'k--', lw=2)
plt.xlabel('Valeurs réelles')
plt.ylabel('Prédictions')
plt.title(f'SVM avec noyau {best_kernel} - Valeurs réelles vs Prédictions')
plt.grid(True)
plt.show()

print(f"Le meilleur modèle utilise le noyau {best_kernel} avec un MSE de {results[best_kernel]['MSE']:.2f}")