In [29]:
import pandas as pd
import joblib
import numpy as np

In [30]:
def predict_from_csv(model_path, scaler_path, csv_file_path):
    """
    Charge un modèle et fait des prédictions sur des données depuis un fichier CSV
    
    Args:
        model_path (str): Chemin vers le modèle sauvegardé
        scaler_path (str): Chemin vers le scaler sauvegardé
        csv_file_path (str): Chemin vers le fichier CSV contenant les nouvelles données
    """
    # Charger le modèle et le scaler
    model = joblib.load(model_path)
    scaler = joblib.load(scaler_path)
    
    # Charger les nouvelles données avec le bon séparateur
    new_data = pd.read_csv(csv_file_path, sep=';')
    
    # Afficher les colonnes disponibles pour le débogage
    print("Colonnes disponibles dans le CSV:", new_data.columns.tolist())
    
    # Définir les caractéristiques attendues et leurs alias possibles
    feature_mapping = {
        'diagonal': ['diagonal', 'diagonale', 'diag'],
        'height_left': ['height_left', 'hauteur_gauche', 'h_left', 'h_gauche'],
        'height_right': ['height_right', 'hauteur_droite', 'h_right', 'h_droite'],
        'margin_low': ['margin_low', 'marge_bas', 'margin_bottom', 'marge_basse'],
        'margin_up': ['margin_up', 'marge_haut', 'margin_high', 'marge_haute'],
        'length': ['length', 'longueur', 'long', 'lng']
    }
    
    # Trouver les noms de colonnes correspondants
    selected_features = []
    available_columns = new_data.columns.tolist()
    
    for standard_name, possible_names in feature_mapping.items():
        found = False
        for possible_name in possible_names:
            if possible_name in available_columns:
                selected_features.append(possible_name)
                found = True
                print(f"Utilisation de '{possible_name}' pour '{standard_name}'")
                break
        
        if not found:
            raise ValueError(f"Aucune colonne correspondante trouvée pour la caractéristique: {standard_name}. "
                           f"Colonnes disponibles: {available_columns}")
    
    # Vérifier que nous avons le bon nombre de caractéristiques
    if len(selected_features) != 6:
        raise ValueError(f"Nombre de caractéristiques incorrect. Attendu: 6, Trouvé: {len(selected_features)}")
    
    # Sélectionner les caractéristiques
    X_new = new_data[selected_features]
    
    # Renommer les colonnes pour la cohérence (optionnel)
    X_new.columns = list(feature_mapping.keys())
    
    # Appliquer le préprocessing
    X_new_scaled = scaler.transform(X_new)
    
    # Faire des prédictions
    predictions = model.predict(X_new_scaled)
    probabilities = model.predict_proba(X_new_scaled)
    
    # Créer un DataFrame avec les résultats
    results = pd.DataFrame({
        'Prédiction': ['Vrai' if pred == 1 else 'Faux' for pred in predictions],
        'Confiance_Vrai': [f"{prob[1]:.2%}" for prob in probabilities],
        'Confiance_Faux': [f"{prob[0]:.2%}" for prob in probabilities]
    })
    
    # Combiner avec les données originales
    final_results = pd.concat([new_data.reset_index(drop=True), results], axis=1)
    
    return final_results

In [34]:
# Exemple d'utilisation
if __name__ == "__main__":
    # Chemins vers vos fichiers
    model_path = "../2_model/best_model_rf.pkl"  # Remplacez par votre chemin
    scaler_path = "../2_model/scaler.pkl"  # Remplacez par votre chemin
    csv_path = "billets_test_fadel.csv"  # Remplacez par le chemin de votre fichier CSV
    
    # Faire les prédictions
    try:
        predictions = predict_from_csv(model_path, scaler_path, csv_path)
        print("Prédictions terminées avec succès!")
        print("\nRésultats:")
        print(predictions.to_string(index=False))
        
        # Statistiques summary
        genuine_count = sum(1 for pred in predictions['Prédiction'] if pred == 'Vrai')
        fake_count = len(predictions) - genuine_count
        print(f"\nRésumé: {genuine_count} vrais billets, {fake_count} faux billets")
        
    except Exception as e:
        print(f"Erreur: {e}")

Colonnes disponibles dans le CSV: ['diagonal', 'height_left', 'height_right', 'margin_low', 'margin_up', 'length']
Utilisation de 'diagonal' pour 'diagonal'
Utilisation de 'height_left' pour 'height_left'
Utilisation de 'height_right' pour 'height_right'
Utilisation de 'margin_low' pour 'margin_low'
Utilisation de 'margin_up' pour 'margin_up'
Utilisation de 'length' pour 'length'
Prédictions terminées avec succès!

Résultats:
 diagonal  height_left  height_right  margin_low  margin_up  length Prédiction Confiance_Vrai Confiance_Faux
   171.81       104.86        104.95        4.52       2.89  112.83       Vrai         84.00%         16.00%
   171.46       103.36        103.66        3.77       2.99  113.09       Vrai        100.00%          0.00%
   172.69       104.48        103.50        4.40       3.54  109.93       Faux          5.50%         94.50%
   171.36       103.91        103.94        3.62       3.01  113.51       Vrai         99.50%          0.50%
   171.73       104.28   

In [32]:
#import joblib
#import numpy as np

# Charger le modèle et le scaler
#model = joblib.load('../2_model/best_model_rf.pkl')
#scaler = joblib.load('../2_model/scaler.pkl')

# Données d'un nouveau billet (à adapter avec vos mesures)
#new_bill = pd.read_csv("data.csv", sep = ";")  # length, height_left, height_right, margin_up, margin_low, diagonal

# Appliquer le préprocessing
#new_bill_scaled = scaler.transform(new_bill)

# Faire la prédiction
#prediction = model.predict(new_bill_scaled)
#probability = model.predict_proba(new_bill_scaled)

# Afficher le résultat
#result = "FAUX" if prediction[0] == 1 else "VRAI"
#confidence = probability[0][1] if prediction[0] == 1 else probability[0][0]

#print(f"Prédiction: Le billet est {result}")
#print(f"Confiance: {confidence:.2%}")