# Projet P12 - Application

In [1]:
# Importation des librairies
import pandas as pd
import numpy as np
from scipy import stats
import statsmodels.stats.api as sms
import matplotlib.pyplot as plt
from matplotlib.collections import LineCollection
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split, cross_val_score, StratifiedKFold, cross_val_predict
from sklearn.linear_model import LinearRegression, LogisticRegression
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay, accuracy_score, precision_score, recall_score, f1_score, r2_score, roc_curve, roc_auc_score, auc, mean_squared_error
from model_training import train_logistic_regression

In [2]:
# Appel de la fonction 'model_training' pour entraîner le modèle
billets_complet = pd.read_csv('billets_complet.csv')
logistic_model, scaler, y_pred_cv = train_logistic_regression(billets_complet)

## <font>Application fonctionnelle<a class="anchor" id="7_1"></a></font>

In [3]:
def detection_fx_billets(model, nom_fichier):
    """
    Fonction permettant la détection de faux billets à partir d'un algorithme de classification déjà entraîné.
    
    Paramètres:
    - model: Modèle de classification déjà entraîné 
    - nom_fichier: Chemin vers le fichier CSV contenant les informations sur les billets
    
    Retourne:
    - DataFrame avec les prédictions et les probabilités de chaque billet
    """
    
    # Importation des données
    df = pd.read_csv(nom_fichier)
    
    # Sélection des données significatives pour la prédiction
    X = df[['diagonal', 'height_left', 'height_right', 'margin_low', 'margin_up', 'length']]
    
    # Standardisation des données
    scaler = StandardScaler()
    X_scaled = scaler.fit_transform(X.values)
    
    # Prédictions et probabilités
    y_pred = model.predict(X_scaled)  # Utilisation des prédictions directes du modèle
    predict_proba = model.predict_proba(X_scaled)[:, 1]  # Probabilité d'être un vrai billet
    
    # Création d'une copie du DataFrame pour ajouter les résultats
    df_pred = df.copy()
    df_pred['prediction'] = y_pred
    df_pred['probabilité vrai %'] = np.round(predict_proba * 100, 2)

    return df_pred

In [4]:
detection_results = detection_fx_billets(logistic_model, 'billets_soutenance.csv')
detection_results.head()

Unnamed: 0,diagonal,height_left,height_right,margin_low,margin_up,length,id,prediction,probabilité vrai %
0,171.76,104.01,103.54,5.21,3.3,111.42,A_1,False,3.51
1,171.87,104.17,104.13,6.0,3.31,112.09,A_2,False,0.86
2,172.0,104.58,104.29,4.99,3.39,111.57,A_3,False,0.58
3,172.49,104.55,104.34,4.44,3.03,113.2,A_4,True,99.99
4,171.65,103.63,103.56,3.77,3.16,113.33,A_5,True,100.0
