# PROJET 10 : Détectez des faux billets avec R ou Python

 <center>
  <img src="ONCF.png" alt="Logo ONCF" width="800"/>
</center>

# ETAPE 7: Application finale de detection des faux billets

In [9]:
import pandas as pd
import pickle

# ✅ Fonction pour lire le CSV et valider les colonnes
def lecture_csv(nom_du_fichier):
    colonnes_attendues = ['diagonal', 'height_left', 'height_right', 'margin_low', 'margin_up', 'length']
    
    try:
        data = pd.read_csv(nom_du_fichier)
    except Exception as e:
        raise ValueError(f"Erreur lors de la lecture du fichier CSV : {e}")

    colonnes_manquantes = [col for col in colonnes_attendues if col not in data.columns]
    if colonnes_manquantes:
        raise ValueError(f"Colonnes manquantes dans le fichier CSV : {colonnes_manquantes}")
    
    return data

# ✅ Fonction de détection des faux billets
def detection_billets(df):
    # Chargement du modèle et du scaler
    with open("model_logistic.pkl", "rb") as f:
        model = pickle.load(f)
    with open("scaler.pkl", "rb") as f:
        scaler = pickle.load(f)

    # Colonnes utilisées pour la prédiction
    features = ['diagonal', 'height_left', 'height_right', 'margin_low', 'margin_up', 'length']
    X = df[features]

    # Standardisation
    X_scaled = scaler.transform(X)

    # Prédictions
    pred = model.predict(X_scaled)
    proba = model.predict_proba(X_scaled)

    # Ajout des résultats
    df['Prédiction'] = ['Faux billet' if p == 0 else 'Vrai billet' for p in pred]
    df['Probabilité de faux'] = proba[:, 0]
    df['Probabilité de vrai'] = proba[:, 1]

    # Réorganisation des colonnes
    colonnes = ['Prédiction', 'Probabilité de faux', 'Probabilité de vrai'] + features
    if 'id' in df.columns:
        colonnes.append('id')
    df = df[[col for col in colonnes if col in df.columns]]

    # Export CSV
    df.to_csv("Résultats_Prediction_Billets.csv", index=False)

    return df


In [13]:
# Lecture du fichier et exécution de la détection
df_billets = lecture_csv("billets_production.csv")
resultats = detection_billets(df_billets)
resultats.head()

Unnamed: 0,Prédiction,Probabilité de faux,Probabilité de vrai,diagonal,height_left,height_right,margin_low,margin_up,length,id
0,Faux billet,0.979398,0.020602,171.76,104.01,103.54,5.21,3.3,111.42,A_1
1,Faux billet,0.995527,0.004473,171.87,104.17,104.13,6.0,3.31,112.09,A_2
2,Faux billet,0.994291,0.005709,172.0,104.58,104.29,4.99,3.39,111.57,A_3
3,Vrai billet,0.100868,0.899132,172.49,104.55,104.34,4.44,3.03,113.2,A_4
4,Vrai billet,0.003546,0.996454,171.65,103.63,103.56,3.77,3.16,113.33,A_5


In [15]:
# Lecture du fichier et exécution de la détection
df_billets = lecture_csv("billets_prod.csv")
resultats = detection_billets(df_billets)
resultats.head()


ValueError: Colonnes manquantes dans le fichier CSV : ['diagonal', 'height_left', 'height_right', 'margin_low', 'margin_up', 'length']

In [17]:
import pandas as pd
import pickle

def detection_billets(nom_fichier_csv):
    # Colonnes attendues
    colonnes_attendues = ['diagonal', 'height_left', 'height_right', 'margin_low', 'margin_up', 'length']
    
    # Lecture du CSV
    try:
        df = pd.read_csv(nom_fichier_csv)
    except Exception as e:
        raise ValueError(f"Erreur lors de la lecture du fichier : {e}")

    # Vérification des colonnes
    colonnes_manquantes = [col for col in colonnes_attendues if col not in df.columns]
    if colonnes_manquantes:
        raise ValueError(f"Colonnes manquantes dans le fichier : {colonnes_manquantes}")
    
    # Chargement du modèle et du scaler
    with open("model_logistic.pkl", "rb") as f:
        model = pickle.load(f)
    with open("scaler.pkl", "rb") as f:
        scaler = pickle.load(f)
    
    # Préparation des données
    X = df[colonnes_attendues]
    X_scaled = scaler.transform(X)

    # Prédictions
    pred = model.predict(X_scaled)
    proba = model.predict_proba(X_scaled)

    # Ajout des colonnes de résultats
    df['Prédiction'] = ['Faux billet' if p == 0 else 'Vrai billet' for p in pred]
    df['Probabilité de faux'] = proba[:, 0]
    df['Probabilité de vrai'] = proba[:, 1]

    # Réorganisation des colonnes
    colonnes_resultat = ['Prédiction', 'Probabilité de faux', 'Probabilité de vrai'] + colonnes_attendues
    if 'id' in df.columns:
        colonnes_resultat.append('id')
    df = df[[col for col in colonnes_resultat if col in df.columns]]

    # Sauvegarde
    df.to_csv("Résultats_Prediction_Billets.csv", index=False)
    
    return df


In [19]:
resultats = detection_billets("billets_production.csv")
resultats.head()

Unnamed: 0,Prédiction,Probabilité de faux,Probabilité de vrai,diagonal,height_left,height_right,margin_low,margin_up,length,id
0,Faux billet,0.979398,0.020602,171.76,104.01,103.54,5.21,3.3,111.42,A_1
1,Faux billet,0.995527,0.004473,171.87,104.17,104.13,6.0,3.31,112.09,A_2
2,Faux billet,0.994291,0.005709,172.0,104.58,104.29,4.99,3.39,111.57,A_3
3,Vrai billet,0.100868,0.899132,172.49,104.55,104.34,4.44,3.03,113.2,A_4
4,Vrai billet,0.003546,0.996454,171.65,103.63,103.56,3.77,3.16,113.33,A_5


In [21]:
resultats = detection_billets("billets_prod.csv")
resultats.head()

ValueError: Colonnes manquantes dans le fichier : ['diagonal', 'height_left', 'height_right', 'margin_low', 'margin_up', 'length']

## 🧠 Conclusion : Détection automatique des faux billets

Dans cette application, nous avons développé un outil intelligent capable de déterminer si un billet est **vrai** ou **faux**, en se basant uniquement sur ses caractéristiques physiques *(diagonale, hauteur, marges, etc.)*.

---

### 🔍 Étapes du fonctionnement :

1. 📁 Le programme commence par **lire un fichier CSV** contenant les mesures des billets à tester grâce à la fonction `lecture_csv()`.  
   Cette fonction joue un rôle essentiel en **vérifiant que toutes les colonnes nécessaires sont présentes** dans le fichier. En cas de colonnes manquantes ou de fichier illisible, elle génère une **erreur explicite** afin d’éviter toute mauvaise prédiction.

2. ⚙️ Ensuite, les données sont **standardisées** pour être compatibles avec celles utilisées lors de l'entraînement du modèle.

3. 🧠 Le programme utilise un **modèle de régression logistique optimisé**, entraîné à l’aide de `GridSearchCV` pour rechercher automatiquement les meilleurs paramètres.

4. 💾 Le modèle et l’outil de normalisation des données (**scaler**) ont été **sauvegardés avec la bibliothèque `pickle`**.

5. ✅ Une fois les prédictions effectuées, le programme ajoute les colonnes suivantes :
   - `**Prédiction**` : indique si le billet est "Vrai billet" ou "Faux billet"
   - `**Probabilité de faux**` : score entre 0 et 1 (proche de 1 = suspicion élevée)
   - `**Probabilité de vrai**` : score entre 0 et 1 (proche de 1 = billet fiable)

6. 💾 Le tout est enregistré dans un fichier final nommé `**Résultats_Prediction_Billets.csv**`, pour consultation ou archivage.

---

### 📦 Note sur `pickle` :

La bibliothèque `pickle` permet de **sauvegarder un modèle entraîné** (ou tout autre objet Python) dans un fichier `.pkl`.  
Cela évite de devoir **réentraîner le modèle à chaque fois**, ce qui est particulièrement utile pour **déployer ou réutiliser l’application sur un autre poste**.

> ✅ En résumé, grâce à `pickle`, le modèle peut être **réutilisé instantanément**, ce qui **fait gagner du temps** et rend l’application **plus efficace**.

---

> ℹ️ *Un billet avec une "Probabilité de faux" élevée mérite un examen plus approfondi.*
