<a href="https://colab.research.google.com/github/Sylva-gif/devops-exercises/blob/master/Regresion_logistique.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [7]:
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, accuracy_score

# 1. Préparation des données
# Données d'exemple
data = {
    "Age": [25, 40, 55, 60, 45, 30, 65, 50, 35, 70],
    "Tension": [120, 130, 145, 150, 135, 125, 160, 140, 128, 155],
    "Glycemie": [0.9, 1.1, 1.5, 1.7, 1.2, 1.0, 1.8, 1.4, 0.95, 1.9],
    "Etat": [0, 0, 1, 1, 0, 0, 1, 1, 0, 1] # 0 = Sain, 1 = Malade
}

df = pd.DataFrame(data)

# Variables explicatives (features) et cible (target)
X = df[["Age", "Tension", "Glycemie"]]
y = df["Etat"]

# Diviser les données en ensembles d'entraînement et de test
# C'est crucial pour évaluer la performance du modèle sur des données non vues
# Utilisation de stratify=y pour maintenir la proportion des classes dans les ensembles d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42, stratify=y)

# 2. Construction et entraînement du modèle
model = LogisticRegression(random_state=42)
model.fit(X_train, y_train)

print("Modèle de régression logistique entraîné avec succès.")

# 3. Prédiction pour un nouveau patient
# Créer un DataFrame pour le nouveau patient avec les mêmes noms de colonnes que les données d'entraînement
nouveau_patient_data = pd.DataFrame([[50, 140, 1.4]], columns=X.columns) # Exemple d'un nouveau patient
prediction_nouveau_patient = model.predict(nouveau_patient_data)

print(f"\nÉtat prédit pour le nouveau patient ({nouveau_patient_data.values[0]}): ", "Malade" if prediction_nouveau_patient[0] == 1 else "Sain")

# 4. Évaluation du modèle sur l'ensemble de test
y_pred_test = model.predict(X_test)

# Matrice de confusion
cm = confusion_matrix(y_test, y_pred_test)
print("\nMatrice de confusion sur l'ensemble de test:")
print(cm)

# Précision (Accuracy)
accuracy = accuracy_score(y_test, y_pred_test)
print(f"\nPrécision du modèle sur l'ensemble de test: {accuracy:.2f}")

Modèle de régression logistique entraîné avec succès.

État prédit pour le nouveau patient ([ 50.  140.    1.4]):  Malade

Matrice de confusion sur l'ensemble de test:
[[2 0]
 [0 1]]

Précision du modèle sur l'ensemble de test: 1.00
