# PROJET 10 : D√©tectez des faux billets avec R ou Python

 <center>
  <img src="ONCF.png" alt="Logo ONCF" width="800"/>
</center>

# ETAPE 7: Application finale de detection des faux billets

In [9]:
import pandas as pd
import pickle

# ‚úÖ Fonction pour lire le CSV et valider les colonnes
def lecture_csv(nom_du_fichier):
    colonnes_attendues = ['diagonal', 'height_left', 'height_right', 'margin_low', 'margin_up', 'length']
    
    try:
        data = pd.read_csv(nom_du_fichier)
    except Exception as e:
        raise ValueError(f"Erreur lors de la lecture du fichier CSV : {e}")

    colonnes_manquantes = [col for col in colonnes_attendues if col not in data.columns]
    if colonnes_manquantes:
        raise ValueError(f"Colonnes manquantes dans le fichier CSV : {colonnes_manquantes}")
    
    return data

# ‚úÖ Fonction de d√©tection des faux billets
def detection_billets(df):
    # Chargement du mod√®le et du scaler
    with open("model_logistic.pkl", "rb") as f:
        model = pickle.load(f)
    with open("scaler.pkl", "rb") as f:
        scaler = pickle.load(f)

    # Colonnes utilis√©es pour la pr√©diction
    features = ['diagonal', 'height_left', 'height_right', 'margin_low', 'margin_up', 'length']
    X = df[features]

    # Standardisation
    X_scaled = scaler.transform(X)

    # Pr√©dictions
    pred = model.predict(X_scaled)
    proba = model.predict_proba(X_scaled)

    # Ajout des r√©sultats
    df['Pr√©diction'] = ['Faux billet' if p == 0 else 'Vrai billet' for p in pred]
    df['Probabilit√© de faux'] = proba[:, 0]
    df['Probabilit√© de vrai'] = proba[:, 1]

    # R√©organisation des colonnes
    colonnes = ['Pr√©diction', 'Probabilit√© de faux', 'Probabilit√© de vrai'] + features
    if 'id' in df.columns:
        colonnes.append('id')
    df = df[[col for col in colonnes if col in df.columns]]

    # Export CSV
    df.to_csv("R√©sultats_Prediction_Billets.csv", index=False)

    return df


In [13]:
# Lecture du fichier et ex√©cution de la d√©tection
df_billets = lecture_csv("billets_production.csv")
resultats = detection_billets(df_billets)
resultats.head()

Unnamed: 0,Pr√©diction,Probabilit√© de faux,Probabilit√© de vrai,diagonal,height_left,height_right,margin_low,margin_up,length,id
0,Faux billet,0.979398,0.020602,171.76,104.01,103.54,5.21,3.3,111.42,A_1
1,Faux billet,0.995527,0.004473,171.87,104.17,104.13,6.0,3.31,112.09,A_2
2,Faux billet,0.994291,0.005709,172.0,104.58,104.29,4.99,3.39,111.57,A_3
3,Vrai billet,0.100868,0.899132,172.49,104.55,104.34,4.44,3.03,113.2,A_4
4,Vrai billet,0.003546,0.996454,171.65,103.63,103.56,3.77,3.16,113.33,A_5


In [15]:
# Lecture du fichier et ex√©cution de la d√©tection
df_billets = lecture_csv("billets_prod.csv")
resultats = detection_billets(df_billets)
resultats.head()


ValueError: Colonnes manquantes dans le fichier CSV : ['diagonal', 'height_left', 'height_right', 'margin_low', 'margin_up', 'length']

In [17]:
import pandas as pd
import pickle

def detection_billets(nom_fichier_csv):
    # Colonnes attendues
    colonnes_attendues = ['diagonal', 'height_left', 'height_right', 'margin_low', 'margin_up', 'length']
    
    # Lecture du CSV
    try:
        df = pd.read_csv(nom_fichier_csv)
    except Exception as e:
        raise ValueError(f"Erreur lors de la lecture du fichier : {e}")

    # V√©rification des colonnes
    colonnes_manquantes = [col for col in colonnes_attendues if col not in df.columns]
    if colonnes_manquantes:
        raise ValueError(f"Colonnes manquantes dans le fichier : {colonnes_manquantes}")
    
    # Chargement du mod√®le et du scaler
    with open("model_logistic.pkl", "rb") as f:
        model = pickle.load(f)
    with open("scaler.pkl", "rb") as f:
        scaler = pickle.load(f)
    
    # Pr√©paration des donn√©es
    X = df[colonnes_attendues]
    X_scaled = scaler.transform(X)

    # Pr√©dictions
    pred = model.predict(X_scaled)
    proba = model.predict_proba(X_scaled)

    # Ajout des colonnes de r√©sultats
    df['Pr√©diction'] = ['Faux billet' if p == 0 else 'Vrai billet' for p in pred]
    df['Probabilit√© de faux'] = proba[:, 0]
    df['Probabilit√© de vrai'] = proba[:, 1]

    # R√©organisation des colonnes
    colonnes_resultat = ['Pr√©diction', 'Probabilit√© de faux', 'Probabilit√© de vrai'] + colonnes_attendues
    if 'id' in df.columns:
        colonnes_resultat.append('id')
    df = df[[col for col in colonnes_resultat if col in df.columns]]

    # Sauvegarde
    df.to_csv("R√©sultats_Prediction_Billets.csv", index=False)
    
    return df


In [19]:
resultats = detection_billets("billets_production.csv")
resultats.head()

Unnamed: 0,Pr√©diction,Probabilit√© de faux,Probabilit√© de vrai,diagonal,height_left,height_right,margin_low,margin_up,length,id
0,Faux billet,0.979398,0.020602,171.76,104.01,103.54,5.21,3.3,111.42,A_1
1,Faux billet,0.995527,0.004473,171.87,104.17,104.13,6.0,3.31,112.09,A_2
2,Faux billet,0.994291,0.005709,172.0,104.58,104.29,4.99,3.39,111.57,A_3
3,Vrai billet,0.100868,0.899132,172.49,104.55,104.34,4.44,3.03,113.2,A_4
4,Vrai billet,0.003546,0.996454,171.65,103.63,103.56,3.77,3.16,113.33,A_5


In [21]:
resultats = detection_billets("billets_prod.csv")
resultats.head()

ValueError: Colonnes manquantes dans le fichier : ['diagonal', 'height_left', 'height_right', 'margin_low', 'margin_up', 'length']

## üß† Conclusion : D√©tection automatique des faux billets

Dans cette application, nous avons d√©velopp√© un outil intelligent capable de d√©terminer si un billet est **vrai** ou **faux**, en se basant uniquement sur ses caract√©ristiques physiques *(diagonale, hauteur, marges, etc.)*.

---

### üîç √âtapes du fonctionnement :

1. üìÅ Le programme commence par **lire un fichier CSV** contenant les mesures des billets √† tester gr√¢ce √† la fonction `lecture_csv()`.  
   Cette fonction joue un r√¥le essentiel en **v√©rifiant que toutes les colonnes n√©cessaires sont pr√©sentes** dans le fichier. En cas de colonnes manquantes ou de fichier illisible, elle g√©n√®re une **erreur explicite** afin d‚Äô√©viter toute mauvaise pr√©diction.

2. ‚öôÔ∏è Ensuite, les donn√©es sont **standardis√©es** pour √™tre compatibles avec celles utilis√©es lors de l'entra√Ænement du mod√®le.

3. üß† Le programme utilise un **mod√®le de r√©gression logistique optimis√©**, entra√Æn√© √† l‚Äôaide de `GridSearchCV` pour rechercher automatiquement les meilleurs param√®tres.

4. üíæ Le mod√®le et l‚Äôoutil de normalisation des donn√©es (**scaler**) ont √©t√© **sauvegard√©s avec la biblioth√®que `pickle`**.

5. ‚úÖ Une fois les pr√©dictions effectu√©es, le programme ajoute les colonnes suivantes :
   - `**Pr√©diction**` : indique si le billet est "Vrai billet" ou "Faux billet"
   - `**Probabilit√© de faux**` : score entre 0 et 1 (proche de 1 = suspicion √©lev√©e)
   - `**Probabilit√© de vrai**` : score entre 0 et 1 (proche de 1 = billet fiable)

6. üíæ Le tout est enregistr√© dans un fichier final nomm√© `**R√©sultats_Prediction_Billets.csv**`, pour consultation ou archivage.

---

### üì¶ Note sur `pickle` :

La biblioth√®que `pickle` permet de **sauvegarder un mod√®le entra√Æn√©** (ou tout autre objet Python) dans un fichier `.pkl`.  
Cela √©vite de devoir **r√©entra√Æner le mod√®le √† chaque fois**, ce qui est particuli√®rement utile pour **d√©ployer ou r√©utiliser l‚Äôapplication sur un autre poste**.

> ‚úÖ En r√©sum√©, gr√¢ce √† `pickle`, le mod√®le peut √™tre **r√©utilis√© instantan√©ment**, ce qui **fait gagner du temps** et rend l‚Äôapplication **plus efficace**.

---

> ‚ÑπÔ∏è *Un billet avec une "Probabilit√© de faux" √©lev√©e m√©rite un examen plus approfondi.*
