---
title: "R√©gression Multinomiale (Softmax Regression)"
---






## Th√©orie

La **r√©gression multinomiale**, aussi appel√©e **r√©gression logistique multinomiale**, est une extension de la r√©gression logistique qui permet de g√©rer plusieurs classes. Elle utilise une fonction **Softmax** en sortie pour assigner une probabilit√© √† chaque classe.

## Hyperparam√®tre utilis√©

Nous allons optimiser :

- **Param√®tre de r√©gularisation (`C`)** : contr√¥le la p√©nalisation de la complexit√© du mod√®le et est s√©lectionn√© en fonction de la pr√©cision sur l'ensemble de validation.

## M√©triques d‚Äô√©valuation

Nous afficherons :

- **Matrice de confusion** : montrant les erreurs de classification sur l'√©chantillon de test.

- **Taux de bien class√©s sur l'√©chantillon de validation** avec le meilleur hyperparam√®tre.

- **Taux de bien class√©s sur l'√©chantillon de test** avec ce m√™me hyperparam√®tre.

- **Taux de bien class√©s par classe sur l'√©chantillon de test** pour observer la pr√©cision sur chaque classe.

## Recherche du meilleur `C` et √©valuation


In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix, accuracy_score
from sklearn.preprocessing import StandardScaler
import warnings

# üîá Suppression des avertissements inutiles
warnings.filterwarnings("ignore", category=UserWarning)

# üîÑ Chargement des ensembles de donn√©es
train_data = pd.read_csv('covertype_train.csv')
val_data = pd.read_csv('covertype_val.csv')
test_data = pd.read_csv('covertype_test.csv')

# üìä Pr√©paration des donn√©es
X_train, y_train = train_data.drop('Cover_Type', axis=1), train_data['Cover_Type']
X_val, y_val = val_data.drop('Cover_Type', axis=1), val_data['Cover_Type']
X_test, y_test = test_data.drop('Cover_Type', axis=1), test_data['Cover_Type']

# üî¢ Normalisation des donn√©es
scaler = StandardScaler()
X_train, X_val, X_test = scaler.fit_transform(X_train), scaler.transform(X_val), scaler.transform(X_test)

# üéØ Recherche du meilleur hyperparam√®tre C
C_values = np.arange(0.1, 1.1, 0.1)
val_accuracies = []

for C in C_values:
    model = LogisticRegression(multi_class='multinomial', solver='saga', C=C, penalty='l2', max_iter=500)
    model.fit(X_train, y_train)
    acc = accuracy_score(y_val, model.predict(X_val))
    val_accuracies.append((C, acc))

# S√©lection du meilleur hyperparam√®tre
best_C, best_val_acc = max(val_accuracies, key=lambda x: x[1])


# üìà Affichage du graphique
plt.figure(figsize=(8, 6))
plt.plot(C_values, [acc for C, acc in val_accuracies], marker='o', linestyle='dashed', label="Validation")
plt.xlabel("Param√®tre de r√©gularisation (C)")
plt.ylabel("Pr√©cision sur validation")
plt.title("Impact de la r√©gularisation sur la performance de la r√©gression multinomiale")
plt.legend()
plt.show()

# üèÜ Mod√®le final avec le meilleur hyperparam√®tre
final_model = LogisticRegression(multi_class='multinomial', solver='saga', C=best_C, penalty='l2', max_iter=500)
final_model.fit(X_train, y_train)
y_test_pred = final_model.predict(X_test)

# üìä Matrice de confusion
conf_matrix = confusion_matrix(y_test, y_test_pred)

# üìà Calcul des taux de bien class√©s par classe
class_accuracies = conf_matrix.diagonal() / conf_matrix.sum(axis=1)
overall_test_accuracy = accuracy_score(y_test, y_test_pred)

# üìù Affichage des r√©sultats
print(f"\nüîπ Meilleur hyperparam√®tre C sur l'√©chantillon de validation : {best_C:.2f}")
print(f"Taux de bien class√©s sur l'√©chantillon de validation avec cet hyperparam√®tre : {best_val_acc:.2%}")
print("\nüìä Matrice de confusion sur l'√©chantillon de test, avec le meilleur hyperparam√®tre :")
print(conf_matrix)

print("\nüìà Taux de bien class√©s par classe sur l'√©chantillon de test, avec le meilleur hyperparam√®tre  :")
for i, acc in enumerate(class_accuracies, start=1):
    print(f"Classe {i} : {acc:.2%}")

print(f"\nüîπ Taux de bien class√©s sur l'√©chantillon de test avec le meilleur hyperparam√®tre : {overall_test_accuracy:.2%}")