# **3.1.	La régression logistique**

In [None]:
import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, fbeta_score
import statsmodels.api as sm
# Chargement des données d'apprentissage à partir de la feuille Excel
df_train = pd.read_excel('/content/exemple_3.1.xlsx', sheet_name='Train')
X_train = df_train[['X1', 'X2', 'X3', 'X4']]
y_train = df_train['Y']
# Normalisation des données d'apprentissage (toutes les variables sont quantitatives)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
# Application du modèle logistique et affichage des résultats
X_train_sm = sm.add_constant(X_train_scaled)  # Ajout d'une constante pour l'ordonnée à l'origine
logit_model = sm.Logit(y_train, X_train_sm)
result = logit_model.fit()
print("Résultats de l'apprentissage :")
print(result.summary())

In [None]:
# Chargement des données de test à partir de la feuille Excel
df_test = pd.read_excel('/content/exemple_3.1.xlsx', sheet_name='Test')
X_test = df_test[['X1', 'X2', 'X3', 'X4']]
y_test = df_test['Y']
# Normalisation des données de test
X_test_scaled = scaler.transform(X_test)
# Prédictions sur la base de données de test
logistic_model = LogisticRegression()
logistic_model.fit(X_train_scaled, y_train)
y_pred = logistic_model.predict(X_test_scaled)
# Ajout de la colonne Y_pred avec les prédictions dans **df_test**
df_test['Y_pred'] = y_pred
# Sauvegarde des résultats dans un fichier Excel
output_path = '/content/predictions.xlsx'
df_test.to_excel(output_path, index=False)
print(f"Les prédictions ont été enregistrées dans {output_path}")


In [None]:
# Évaluation
accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred, average='weighted')
recall = recall_score(y_test, y_pred, average='weighted')
f1 = f1_score(y_test, y_pred, average='weighted')
f2 = fbeta_score(y_test, y_pred, beta=2, average='weighted')
# Affichage des métriques d'évaluation
print("\nÉvaluation sur les données de test :")
print("Accuracy:", accuracy)
print("Precision:", precision)
print("Recall:", recall)
print("F1-score:", f1)
print("F2-score:", f2)

## 3.2.	Les k plus proches **voisins**

In [None]:
# Importation des bibliothèques
import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, fbeta_score
# Chargement des données d'apprentissage à partir de la feuille Excel
df_train = pd.read_excel('/content/exemple_3.1.xlsx', sheet_name='Train')
X_train = df_train[['X1', 'X2', 'X3', 'X4']]
y_train = df_train['Y']
# Normalisation des données d'apprentissage (toutes les variables sont quantitatives)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
# Application du modèle KNN
knn_model = KNeighborsClassifier(n_neighbors=3)  # Choix de k = 3 voisins
knn_model.fit(X_train_scaled, y_train)  # Entraînement du modèle
# Chargement des données de test à partir de la feuille Excel
df_test = pd.read_excel('/content/exemple_3.1.xlsx', sheet_name='Test')
X_test = df_test[['X1', 'X2', 'X3', 'X4']]
y_test = df_test['Y']
# Normalisation des données de test
X_test_scaled = scaler.transform(X_test)
# Prédictions sur la base de données de test
y_pred = knn_model.predict(X_test_scaled)
# Ajout de la colonne Y_pred avec les prédictions dans df_test
df_test['Y_pred'] = y_pred
# Enregistrement des résultats dans un nouveau fichier Excel
df_test.to_excel('/content/Client_impulsif_with_predictions_knn.xlsx', sheet_name='Test', index=False)
# Évaluation
accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred, average='weighted')
recall = recall_score(y_test, y_pred, average='weighted')
f1 = f1_score(y_test, y_pred, average='weighted')
f2 = fbeta_score(y_test, y_pred, beta=2, average='weighted')
# Affichage des métriques d'évaluation
print("\nÉvaluation sur les données de test avec KNN :")
print("Accuracy:", accuracy)
print("Precision:", precision)
print("Recall:", recall)
print("F1-score:", f1)
print("F2-score:", f2)


3.3.	Machine à vecteurs de support (SVM)

In [9]:
# Code python
# Importation des bibliothèques
import pandas as pd
from sklearn.svm import SVC
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, fbeta_score
# Chargement et préparation des données d'entraînement
df_train = pd.read_excel('/content/exemple_3.1.xlsx', sheet_name='Train')
X_train = df_train[['X1', 'X2', 'X3', 'X4']]
y_train = df_train['Y']
# Standardisation des données d'entraînement
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
# Initialisation du modèle SVM
modele_svm = SVC(kernel='linear')  # Vous pouvez ajuster les paramètres kernel et C
# Entraînement du modèle
modele_svm.fit(X_train_scaled, y_train)
# Chargement et préparation des données de test
df_test = pd.read_excel('/content/exemple_3.1.xlsx', sheet_name='Test')
X_test = df_test[['X1', 'X2', 'X3', 'X4']]
y_test = df_test['Y']
# Normalisation des données de test
X_test_scaled = scaler.transform(X_test)
# Prédictions
y_pred = modele_svm.predict(X_test_scaled)
df_test['Y_pred'] = y_pred
# Sauvegarde des prédictions dans un fichier Excel
df_test.to_excel('/content/svm.xlsx', sheet_name='Test', index=False)
# Calcul et affichage des métriques d'évaluation
accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred, average='weighted')
recall = recall_score(y_test, y_pred, average='weighted')
f1 = f1_score(y_test, y_pred, average='weighted')
f2 = fbeta_score(y_test, y_pred, beta=2, average='weighted')
print("\nÉvaluation sur les données de test avec SVM :")
print("Exactitude (Accuracy) :", accuracy)
print("Précision (Precision) :", precision)
print("Rappel (Recall) :", recall)
print("Score F1 :", f1)
print("Score F2 :", f2)



Évaluation sur les données de test avec SVM :
Exactitude (Accuracy) : 0.9
Précision (Precision) : 0.9142857142857143
Rappel (Recall) : 0.9
Score F1 : 0.8967032967032967
Score F2 : 0.896434634974533
