###<font color = 'bisque'> Import des packages

In [None]:
# importer les packages
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

###<font color = 'bisque'> Lecture des données

In [None]:
# importer les données


| **Variable**           | **Description (FR)**                                                                 |
| ---------------------- | ------------------------------------------------------------------------------------ |
| `TransactionId`        | Identifiant unique de la transaction sur la plateforme                               |
| `BatchId`              | Numéro unique attribué à un lot de transactions pour le traitement                   |
| `AccountId`            | Numéro unique identifiant le client sur la plateforme                                |
| `SubscriptionId`       | Numéro unique identifiant l’abonnement du client                                     |
| `CustomerId`           | Identifiant unique attaché au compte                                                 |
| `CurrencyCode`         | Devise du pays                                                                       |
| `CountryCode`          | Code géographique numérique du pays                                                  |
| `ProviderId`           | Fournisseur source de l’article acheté                                               |
| `ProductId`            | Nom de l’article acheté                                                              |
| `ProductCategory`      | Les ProductId sont regroupés dans ces grandes catégories de produits                 |
| `ChannelId`            | Indique si le client a utilisé le web, Android, iOS, le paiement différé ou checkout |
| `Amount`               | Valeur de la transaction. Positive pour les débits, négative pour les crédits        |
| `Value`                | Valeur absolue du montant                                                            |
| `TransactionStartTime` | Heure de début de la transaction                                                     |
| `PricingStrategy`      | Catégorie de la structure tarifaire de Xente pour les marchands                      |


In [None]:
# Afficher les données en utilisant head ou tail


In [None]:
# dimension des données


In [None]:
# infos des données


###<font color = 'bisque'>Exploration des données avec Matplolib, Seaborn et Plotly Express

1. Analyse des volumes de transactions

In [None]:
# Transactions par jour
transactions_per_day = df.groupby('Date').size()

In [None]:
plt.figure(figsize=(14, 5))
transactions_per_day.plot()
plt.title("Nombre de transactions par jour")
plt.xlabel("Date")
plt.ylabel("Nombre de transactions")
plt.show()

In [None]:
# Transactions par heure
plt.figure(figsize=(10, 5))
sns.countplot(data=df, x='Hour', color='skyblue')
plt.title("Répartition des transactions par heure")
plt.xlabel("Heure")
plt.ylabel("Nombre de transactions")
plt.show()

In [None]:
# Transactions par canal (pie chart)
channel_counts = df['ChannelId'].value_counts().reset_index()
channel_counts.columns = ['ChannelId', 'Count']

In [None]:
fig = px.pie(channel_counts, names='ChannelId', values='Count',
             title="Répartition des transactions par canal")
fig.show()

2. Analyse de la rentabilité

In [None]:
# Taux de rentabilité par ProductCategory
rentabilite = df.groupby('ProductCategory')['TauxRentabilité'].mean().sort_values()

In [None]:
plt.figure(figsize=(12, 5))
rentabilite.plot(kind='barh', color='teal')
plt.title("Taux de rentabilité moyen par catégorie")
plt.xlabel("Taux de rentabilité")
plt.show()

In [None]:
# Heatmap des corrélations
plt.figure(figsize=(8, 5))
sns.heatmap(df[['Amount', 'Value', 'MargeBrute', 'TauxRentabilité']].corr(),
            annot=True, cmap='coolwarm')
plt.title("Corrélations entre variables financières")
plt.show()

3. Analyse par produit et catégorie

In [None]:
# Revenus par catégorie
revenue_per_category = df.groupby('ProductCategory')['Value'].sum().sort_values(ascending=False).reset_index()

In [None]:
fig = px.bar(revenue_per_category,
             x='ProductCategory', y='Value',
             title="Revenu total par catégorie de produit",
             color='Value')
fig.show()

4. Analyse temporelle de la marge

In [None]:
# Marge moyenne par jour
marge_par_mois = df.groupby('Day')['MargeBrute'].mean()

In [None]:
plt.figure(figsize=(10, 5))
marge_par_mois.plot(marker='o', color='purple')
plt.title("Marge brute moyenne par jour")
plt.xlabel("Jour")
plt.ylabel("Marge moyenne (UGX)")
plt.grid(True)
plt.show()

5. Top contributeurs

In [None]:
# Top clients
top_clients = df.groupby('CustomerId')['MargeBrute'].sum().sort_values(ascending=False).head(10).reset_index()

In [None]:
fig = px.bar(top_clients, x='CustomerId', y='MargeBrute',
             title="Top 10 clients par marge brute",
             text='MargeBrute')
fig.show()

In [None]:
# Catégories les plus concernées par les remboursements
remboursements = df[df['Amount'] < 0]

In [None]:
plt.figure(figsize=(10, 5))
remboursements['ProductCategory'].value_counts().head(5).plot(kind='bar', color='red')
plt.title("Catégories avec le plus de remboursements")
plt.xlabel("ProductCategory")
plt.ylabel("Nombre de remboursements")
plt.show()