In [None]:
# 1. Importer les bibliothèques nécessaires
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import classification_report, confusion_matrix

# 2. Charger le dataset "Credit Card Fraud Detection" depuis Kaggle
from google.colab import files
uploaded = files.upload()

# Charger le fichier CSV (assurez-vous d'avoir téléchargé le fichier sur votre machine et utilisez files.upload() pour l'importer)
df = pd.read_csv('creditcard.csv')  # Le nom du fichier dépend de ce que vous avez téléchargé

# 3. Exploration des données
print(df.head())
print(df.info())

# 4. Vérification des valeurs manquantes
print(df.isnull().sum())

# 5. Normalisation des données (caractéristiques)
scaler = StandardScaler()
df[['V1', 'V2', 'V3', 'V4', 'V5', 'V6', 'V7', 'V8', 'V9', 'V10', 'V11', 'V12', 'V13', 'V14', 'V15', 'V16', 'V17', 'V18', 'V19', 'V20', 'V21', 'V22', 'V23', 'V24', 'V25', 'V26', 'V27', 'V28', 'Amount']] = scaler.fit_transform(df[['V1', 'V2', 'V3', 'V4', 'V5', 'V6', 'V7', 'V8', 'V9', 'V10', 'V11', 'V12', 'V13', 'V14', 'V15', 'V16', 'V17', 'V18', 'V19', 'V20', 'V21', 'V22', 'V23', 'V24', 'V25', 'V26', 'V27', 'V28', 'Amount']])

# 6. Séparer les données en caractéristiques (X) et variable cible (y)
X = df.drop('Class', axis=1)  # 'Class' est la variable cible (frauduleuse ou non)
y = df['Class']  # 0 : transaction non frauduleuse, 1 : fraude

# 7. Diviser le dataset en ensembles d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 8. Créer un modèle de régression logistique simple
model = LogisticRegression(max_iter=1000)
model.fit(X_train, y_train)

# 9. Faire des prédictions sur les données de test
y_pred = model.predict(X_test)

# 10. Évaluation du modèle
print("Classification Report:")
print(classification_report(y_test, y_pred))

print("Confusion Matrix:")
print(confusion_matrix(y_test, y_pred))

# 11. Visualisation des résultats (Confusion Matrix)
plt.figure(figsize=(8, 6))
sns.heatmap(confusion_matrix(y_test, y_pred), annot=True, fmt='d', cmap='Blues', xticklabels=['Non Fraude', 'Fraude'], yticklabels=['Non Fraude', 'Fraude'])
plt.title('Confusion Matrix')
plt.xlabel('Prédictions')
plt.ylabel('Réels')
plt.show()

# 12. Détection simple basée sur un seuil de montant
def simple_fraud_detection(transaction):
    # Si le montant dépasse un certain seuil, on considère que c'est potentiellement une fraude
    if transaction['Amount'] > 1000:  # Exemple : seuil de 1000
        return 1  # Fraude
    return 0  # Non fraude

# Tester la détection simple sur un échantillon
sample_transaction = X_test.iloc[0]
print("Transaction:", sample_transaction)
print("Détection simple (basée sur montant):", simple_fraud_detection(sample_transaction))

def generate_pdf_documentation(suspicious_transactions, y_test, y_pred):
    c = canvas.Canvas("fraud_detection_report.pdf", pagesize=letter)
    c.drawString(1 * inch, 10 * inch, "Fraud Detection Report")

    # Add model evaluation metrics to the PDF
    y_position = 9 * inch
    c.drawString(1 * inch, y_position, "Model Evaluation Metrics:")
    y_position -= 0.2 * inch
    report = classification_report(y_test, y_pred, output_dict=True)
    for metric, value in report.items():
        if isinstance(value, dict):
            for class_label, class_metric in value.items():
                c.drawString(1 * inch, y_position, f"{metric} (class {class_label}): {class_metric:.2f}")
                y_position -= 0.2 * inch
        else:
            c.drawString(1 * inch, y_position, f"{metric}: {value:.2f}")
            y_position -= 0.2 * inch

    # ... (rest of your PDF generation code) ...

generate_pdf_documentation(suspicious_transactions, y_test, y_pred)
