# Breast Cancer Prediction using Random Forest

In [None]:
# Breast Cancer Prediction (Random Forest)

# 1. Importation des bibliothèques
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, confusion_matrix
from sklearn.metrics import accuracy_score

import joblib

# 2. Chargement des données
df = pd.read_csv("Breast_cancer_data.csv")

# 3. Définition des variables explicatives (X) et cible (y)
X = df.drop("diagnosis", axis=1)
y = df["diagnosis"]

# 4. Standardisation des variables
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# 5. Division des données en entraînement et test
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# 6. Entraînement du modèle Random Forest
model = RandomForestClassifier(random_state=42)
model.fit(X_train, y_train)

# 7. Évaluation du modèle
y_pred = model.predict(X_test)
print("🎯 Accuracy globale :", accuracy_score(y_test, y_pred))

print("🔍 Rapport de classification :\n", classification_report(y_test, y_pred))
print("📊 Matrice de confusion :\n", confusion_matrix(y_test, y_pred))

# 8. Sauvegarde du modèle et du scaler
joblib.dump(model, "breast_model.pkl")
joblib.dump(scaler, "scaler.pkl")
print("💾 Modèle et scaler sauvegardés avec succès.")

# 9. Test rapide avec un cas de prédiction
test_values = [[20.57, 17.77, 132.9, 1326.0, 0.08474]]  # Cas malin connu
test_scaled = scaler.transform(test_values)
prediction = model.predict(test_scaled)[0]

# 10. Affichage du résultat de prédiction
if prediction == 1:
    print("✅ Prédiction : Bénin")
else:
    print("⚠️ Prédiction : Malin")


🎯 Accuracy globale : 0.9473684210526315
🔍 Rapport de classification :
               precision    recall  f1-score   support

           0       0.91      0.95      0.93        43
           1       0.97      0.94      0.96        71

    accuracy                           0.95       114
   macro avg       0.94      0.95      0.94       114
weighted avg       0.95      0.95      0.95       114

📊 Matrice de confusion :
 [[41  2]
 [ 4 67]]
💾 Modèle et scaler sauvegardés avec succès.
⚠️ Prédiction : Malin




In [None]:
# Test prédiction : Cas bénin
# Exemple : [mean_radius, mean_texture, mean_perimeter, mean_area, mean_smoothness]
test_values_benign = [[13.54, 14.36, 87.46, 566.3, 0.09779]]  # Cas bénin connu

# Charger les objets
import joblib
model = joblib.load("breast_model.pkl")
scaler = joblib.load("scaler.pkl")

# Standardisation et prédiction
test_scaled_benign = scaler.transform(test_values_benign)
prediction_benign = model.predict(test_scaled_benign)[0]

# Résultat
if prediction_benign == 1:
    print("✅ Prédiction : Bénin")
else:
    print("⚠️ Prédiction : Malin")


✅ Prédiction : Bénin


