In [None]:
# Projet Python pour la Finance - Analyse de Transactions

In [None]:
## 1. Import des bibliothèques
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

In [None]:
# Affichage clair
pd.set_option('display.max_columns', None)

In [None]:
## 2. Chargement des données
df = pd.read_csv("Transactions_data_complet.csv")

In [None]:
## 3. Nettoyage et préparation
df['TransactionStartTime'] = pd.to_datetime(df['TransactionStartTime'])
df['Year'] = df['TransactionStartTime'].dt.year
df['Month'] = df['TransactionStartTime'].dt.month
df['DayOfWeek'] = df['TransactionStartTime'].dt.day_name()
df['Hour'] = df['TransactionStartTime'].dt.hour

In [None]:
## 4. Aperçu général
print("Aperçu du jeu de données :")
print(df.head())

In [None]:
print("\nStatistiques descriptives :")
print(df.describe(include='all'))

In [None]:
print("\nValeurs manquantes :")
print(df.isnull().sum())

In [None]:
## 5. Analyse de la fraude
fraud_counts = df['FraudResult'].value_counts()
fraud_percentage = df['FraudResult'].value_counts(normalize=True) * 100

In [None]:
print("\nRépartition de la variable 'FraudResult' :")
print(fraud_counts)
print("\nPourcentage :")
print(fraud_percentage)

In [None]:
## 6. Visualisations

In [None]:
### Histogramme du montant des transactions
plt.figure(figsize=(10,6))
sns.histplot(df['Amount'], bins=50, kde=True)
plt.title("Distribution des montants de transaction")
plt.xlabel("Montant")
plt.ylabel("Fréquence")
plt.show()

In [None]:
### Répartition des fraudes par canal
fraud_by_channel = df[df['FraudResult'] == 1]['ChannelId'].value_counts()
plt.figure(figsize=(8,5))
fraud_by_channel.plot(kind='bar', color='crimson')
plt.title("Fraudes par canal")
plt.xlabel("ChannelId")
plt.ylabel("Nombre de fraudes")
plt.show()

In [None]:
### Heatmap de corrélation
plt.figure(figsize=(12,8))
sns.heatmap(df.corr(numeric_only=True), annot=True, cmap='coolwarm')
plt.title("Corrélation entre variables numériques")
plt.show()

In [None]:
### Boxplot du montant par catégorie de produit
plt.figure(figsize=(12,6))
sns.boxplot(x='ProductCategory', y='Amount', data=df)
plt.title("Montant par catégorie de produit")
plt.xticks(rotation=45)
plt.show()

In [None]:
### Graphique interactif - Fraude par jour de la semaine
fig = px.histogram(df, x="DayOfWeek", color="FraudResult", barmode="group",
                   category_orders={"DayOfWeek": ["Monday", "Tuesday", "Wednesday", "Thursday", "Friday", "Saturday", "Sunday"]},
                   title="Répartition des fraudes par jour de la semaine")
fig.show()