# üìä Notebook 03 : Analyse & Dashboard

**Auteur** : Oumaro Titans DJIGUIMDE  
**Date** : F√©vrier 2026  
**Objectif** : Analyser le flux transform√© et produire des insights business

---

## üéØ Objectifs de ce notebook

1. Charger les donn√©es transform√©es
2. Calculer des KPIs business
3. Cr√©er des visualisations avanc√©es
4. Identifier des insights m√©tier
5. Produire des recommandations

## üì¶ Importation des biblioth√®ques

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime

# Configuration
pd.set_option('display.max_columns', None)
pd.set_option('display.float_format', '{:,.0f}'.format)

# Style
plt.style.use('seaborn-v0_8-whitegrid')
sns.set_palette('Set2')
plt.rcParams['figure.figsize'] = (14, 6)

print("‚úÖ Biblioth√®ques import√©es avec succ√®s")

## 1Ô∏è‚É£ Chargement des donn√©es transform√©es

In [None]:
print("="*70)
print("üìÇ CHARGEMENT DES DONN√âES")
print("="*70)

# Dataset principal
df = pd.read_csv('../data/transactions_transformed.csv', parse_dates=['timestamp', 'date'])

# Agr√©gations
agg_ville = pd.read_csv('../data/agg_ville.csv', index_col=0)
agg_type = pd.read_csv('../data/agg_type.csv', index_col=0)
agg_hour = pd.read_csv('../data/agg_hour.csv', index_col=0)
agg_day = pd.read_csv('../data/agg_day.csv', index_col=0, parse_dates=['date'])

print(f"\n‚úÖ Donn√©es charg√©es")
print(f"   ‚Ä¢ Transactions : {len(df):,}")
print(f"   ‚Ä¢ P√©riode : {df['date'].min()} ‚Üí {df['date'].max()}")
print("="*70)

## 2Ô∏è‚É£ KPIs Business

In [None]:
print("="*70)
print("üìà INDICATEURS CL√âS DE PERFORMANCE (KPIs)")
print("="*70)

# KPIs globaux
total_transactions = len(df)
volume_total = df['amount'].sum()
montant_moyen = df['amount'].mean()
montant_median = df['amount'].median()
nb_jours = df['date'].nunique()
transactions_jour = total_transactions / nb_jours
volume_jour = volume_total / nb_jours

print(f"\nüí∞ VOLUME :")
print(f"   ‚Ä¢ Volume total : {volume_total:,.0f} FCFA")
print(f"   ‚Ä¢ Volume/jour : {volume_jour:,.0f} FCFA")

print(f"\nüìä TRANSACTIONS :")
print(f"   ‚Ä¢ Total transactions : {total_transactions:,}")
print(f"   ‚Ä¢ Transactions/jour : {transactions_jour:,.0f}")

print(f"\nüíµ MONTANTS :")
print(f"   ‚Ä¢ Montant moyen : {montant_moyen:,.0f} FCFA")
print(f"   ‚Ä¢ Montant m√©dian : {montant_median:,.0f} FCFA")

# Par ville
ville_leader = agg_ville['Volume_total'].idxmax()
volume_leader = agg_ville.loc[ville_leader, 'Volume_total']
part_leader = (volume_leader / volume_total) * 100

print(f"\nüèôÔ∏è  G√âOGRAPHIE :")
print(f"   ‚Ä¢ Ville leader : {ville_leader}")
print(f"   ‚Ä¢ Part de march√© : {part_leader:.1f}%")

# Par type
type_dominant = agg_type['Volume_total'].idxmax()
volume_dominant = agg_type.loc[type_dominant, 'Volume_total']
part_dominant = (volume_dominant / volume_total) * 100

print(f"\nüí≥ TYPES :")
print(f"   ‚Ä¢ Type dominant : {type_dominant}")
print(f"   ‚Ä¢ Part du volume : {part_dominant:.1f}%")

print("\n" + "="*70)

## 3Ô∏è‚É£ Dashboard - Vue d'ensemble

In [None]:
# Dashboard principal
fig, axes = plt.subplots(2, 2, figsize=(16, 12))
fig.suptitle('üìä DASHBOARD - VUE D\'ENSEMBLE', fontsize=18, fontweight='bold', y=1.00)

# 1. Volume par ville
agg_ville['Volume_total'].sort_values(ascending=True).plot(
    kind='barh', ax=axes[0, 0], color='skyblue', alpha=0.8
)
axes[0, 0].set_title('Volume Total par Ville', fontsize=14, fontweight='bold')
axes[0, 0].set_xlabel('Volume (FCFA)')
axes[0, 0].grid(True, alpha=0.3, axis='x')

# 2. Transactions par type
agg_type['Nb_transactions'].plot(
    kind='bar', ax=axes[0, 1], color='coral', alpha=0.8
)
axes[0, 1].set_title('Nombre de Transactions par Type', fontsize=14, fontweight='bold')
axes[0, 1].set_xlabel('Type')
axes[0, 1].set_ylabel('Nombre')
axes[0, 1].tick_params(axis='x', rotation=45)
axes[0, 1].grid(True, alpha=0.3, axis='y')

# 3. √âvolution journali√®re
agg_day['Volume_total'].plot(
    kind='line', ax=axes[1, 0], marker='o', color='green', linewidth=2, markersize=6
)
axes[1, 0].set_title('√âvolution du Volume Journalier', fontsize=14, fontweight='bold')
axes[1, 0].set_xlabel('Date')
axes[1, 0].set_ylabel('Volume (FCFA)')
axes[1, 0].tick_params(axis='x', rotation=45)
axes[1, 0].grid(True, alpha=0.3)

# 4. Distribution horaire
agg_hour['Nb_transactions'].plot(
    kind='bar', ax=axes[1, 1], color='orange', alpha=0.8
)
axes[1, 1].set_title('Distribution Horaire des Transactions', fontsize=14, fontweight='bold')
axes[1, 1].set_xlabel('Heure')
axes[1, 1].set_ylabel('Nombre')
axes[1, 1].grid(True, alpha=0.3, axis='y')

plt.tight_layout()
plt.show()

## 4Ô∏è‚É£ Analyses d√©taill√©es

In [None]:
# Analyse par op√©rateur et ville
pivot_op_ville = df.pivot_table(
    values='amount',
    index='operator',
    columns='city',
    aggfunc='sum'
)

print("="*70)
print("üìä VOLUME PAR OP√âRATEUR ET VILLE")
print("="*70)
print(pivot_op_ville)
print("\n" + "="*70)

In [None]:
# Heatmap op√©rateur √ó ville
plt.figure(figsize=(10, 6))
sns.heatmap(pivot_op_ville, annot=True, fmt='.0f', cmap='YlOrRd', linewidths=0.5)
plt.title('Heatmap : Volume par Op√©rateur et Ville', fontsize=16, fontweight='bold')
plt.xlabel('Ville', fontsize=12)
plt.ylabel('Op√©rateur', fontsize=12)
plt.tight_layout()
plt.show()

In [None]:
# Analyse par p√©riode de la journ√©e
period_analysis = df.groupby('period').agg({
    'transaction_id': 'count',
    'amount': ['sum', 'mean']
})
period_analysis.columns = ['Nb_transactions', 'Volume_total', 'Montant_moyen']

print("‚è∞ ANALYSE PAR P√âRIODE DE LA JOURN√âE")
print("="*70)
print(period_analysis.sort_values('Volume_total', ascending=False))
print("\n" + "="*70)

In [None]:
# Visualisation p√©riode
fig, axes = plt.subplots(1, 2, figsize=(15, 6))

# Volume par p√©riode
period_analysis['Volume_total'].plot(
    kind='bar', ax=axes[0], color='teal', alpha=0.8
)
axes[0].set_title('Volume par P√©riode de la Journ√©e', fontsize=14, fontweight='bold')
axes[0].set_xlabel('P√©riode')
axes[0].set_ylabel('Volume (FCFA)')
axes[0].tick_params(axis='x', rotation=45)
axes[0].grid(True, alpha=0.3, axis='y')

# Montant moyen par p√©riode
period_analysis['Montant_moyen'].plot(
    kind='bar', ax=axes[1], color='purple', alpha=0.8
)
axes[1].set_title('Montant Moyen par P√©riode', fontsize=14, fontweight='bold')
axes[1].set_xlabel('P√©riode')
axes[1].set_ylabel('Montant moyen (FCFA)')
axes[1].tick_params(axis='x', rotation=45)
axes[1].grid(True, alpha=0.3, axis='y')

plt.tight_layout()
plt.show()

## 5Ô∏è‚É£ Analyse de tendances

In [None]:
# Tendances par jour de la semaine
weekday_analysis = df.groupby('day_name').agg({
    'transaction_id': 'count',
    'amount': 'sum'
})
weekday_analysis.columns = ['Nb_transactions', 'Volume_total']

# R√©ordonner les jours
jours_ordre = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
weekday_analysis = weekday_analysis.reindex(jours_ordre)

print("üìÖ ANALYSE PAR JOUR DE LA SEMAINE")
print("="*70)
print(weekday_analysis)
print("\n" + "="*70)

In [None]:
# Visualisation jour de la semaine
plt.figure(figsize=(14, 6))
weekday_analysis['Volume_total'].plot(
    kind='line', marker='o', color='darkblue', linewidth=2.5, markersize=8
)
plt.title('Volume Transactionnel par Jour de la Semaine', fontsize=16, fontweight='bold')
plt.xlabel('Jour', fontsize=12)
plt.ylabel('Volume (FCFA)', fontsize=12)
plt.grid(True, alpha=0.3)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

## 6Ô∏è‚É£ Insights & Recommandations

In [None]:
print("="*70)
print("üí° INSIGHTS M√âTIER")
print("="*70)

# 1. Ville dominante
ville_top = agg_ville['Volume_total'].idxmax()
part_ville_top = (agg_ville.loc[ville_top, 'Volume_total'] / volume_total) * 100
print(f"\nüèôÔ∏è  G√©ographie :")
print(f"   ‚Ä¢ {ville_top} g√©n√®re {part_ville_top:.1f}% du volume total")
print(f"   ‚Ä¢ Concentration g√©ographique √† optimiser")

# 2. Type dominant
type_top = agg_type['Volume_total'].idxmax()
part_type_top = (agg_type.loc[type_top, 'Volume_total'] / volume_total) * 100
print(f"\nüí≥ Types de transactions :")
print(f"   ‚Ä¢ {type_top} repr√©sente {part_type_top:.1f}% du volume")
print(f"   ‚Ä¢ Focus commercial sur ce segment")

# 3. Heures de pointe
heure_pointe = agg_hour['Nb_transactions'].idxmax()
trans_pointe = agg_hour.loc[heure_pointe, 'Nb_transactions']
print(f"\n‚è∞ Patterns temporels :")
print(f"   ‚Ä¢ Heure de pointe : {heure_pointe}h ({trans_pointe:,.0f} transactions)")
print(f"   ‚Ä¢ Capacit√© infrastructure √† dimensionner")

# 4. P√©riode optimale
periode_optimale = period_analysis['Volume_total'].idxmax()
volume_periode = period_analysis.loc[periode_optimale, 'Volume_total']
print(f"\nüåû P√©riodes :")
print(f"   ‚Ä¢ P√©riode optimale : {periode_optimale} ({volume_periode:,.0f} FCFA)")
print(f"   ‚Ä¢ Marketing cibl√© sur ces horaires")

# 5. Weekend vs semaine
weekend_vol = df[df['is_weekend'] == 1]['amount'].sum()
semaine_vol = df[df['is_weekend'] == 0]['amount'].sum()
ratio_weekend = (weekend_vol / semaine_vol) * 100
print(f"\nüìÖ Weekend :")
print(f"   ‚Ä¢ Volume weekend / semaine : {ratio_weekend:.1f}%")
if ratio_weekend < 80:
    print(f"   ‚Ä¢ Opportunit√© : campagnes weekend")

print("\n" + "="*70)

In [None]:
print("="*70)
print("üéØ RECOMMANDATIONS STRAT√âGIQUES")
print("="*70)

print("\n1Ô∏è‚É£ INFRASTRUCTURE :")
print(f"   ‚Ä¢ Renforcer la capacit√© aux heures de pointe ({heure_pointe}h)")
print(f"   ‚Ä¢ Pr√©voir scaling automatique")

print("\n2Ô∏è‚É£ MARKETING :")
print(f"   ‚Ä¢ Cibler les campagnes sur {ville_top} (ville dominante)")
print(f"   ‚Ä¢ D√©velopper les autres villes pour √©quilibrer")
print(f"   ‚Ä¢ Promotions en p√©riode {periode_optimale}")

print("\n3Ô∏è‚É£ PRODUIT :")
print(f"   ‚Ä¢ Optimiser l'exp√©rience {type_top}")
print(f"   ‚Ä¢ D√©velopper les types √† faible volume")

print("\n4Ô∏è‚É£ OP√âRATIONS :")
print(f"   ‚Ä¢ Monitoring temps r√©el aux heures de pointe")
print(f"   ‚Ä¢ Alertes sur baisse de volume")
print(f"   ‚Ä¢ Dashboard live pour les √©quipes")

print("\n5Ô∏è‚É£ ANALYTICS :")
print(f"   ‚Ä¢ Pr√©diction de volume (machine learning)")
print(f"   ‚Ä¢ D√©tection d'anomalies")
print(f"   ‚Ä¢ Segmentation client")

print("\n" + "="*70)

## üìå R√©sum√© du projet

### ‚úÖ Pipeline complet r√©alis√©

1. **Simulation** (Notebook 01) :
   - ‚úÖ G√©n√©ration de 10 000 transactions
   - ‚úÖ Patterns r√©alistes
   - ‚úÖ Contexte s√©n√©galais

2. **Transformation** (Notebook 02) :
   - ‚úÖ Nettoyage et validation
   - ‚úÖ Features temporelles
   - ‚úÖ M√©triques d√©riv√©es
   - ‚úÖ Agr√©gations multiples

3. **Analyse** (Notebook 03) :
   - ‚úÖ KPIs business
   - ‚úÖ Dashboard visuel
   - ‚úÖ Insights m√©tier
   - ‚úÖ Recommandations strat√©giques

### üìä R√©sultats cl√©s

- **Volume total** : ~530 millions FCFA
- **Transactions** : 10 000 sur 7 jours
- **Montant moyen** : ~53 000 FCFA
- **Ville leader** : Concentration √† optimiser
- **Type dominant** : 45% du volume
- **Patterns** : Heures de pointe identifi√©es

### üéØ Comp√©tences d√©montr√©es

‚úÖ **Ing√©nierie de donn√©es** : Pipeline ETL complet  
‚úÖ **Transformation** : Features engineering  
‚úÖ **Agr√©gation** : Multiples dimensions  
‚úÖ **Visualisation** : Dashboard analytique  
‚úÖ **Business Intelligence** : KPIs et insights  
‚úÖ **Communication** : Recommandations actionnables  

### üöÄ Applications possibles

- **Monitoring temps r√©el** de plateformes de paiement
- **Dashboards op√©rationnels** pour fintechs
- **Reporting** pour la direction
- **Base** pour machine learning (pr√©diction, anomalies)
- **Foundation** pour syst√®mes de streaming (Kafka, etc.)

---

**Projet termin√© ! üéâ**  
Pipeline de donn√©es temps r√©el fonctionnel et document√©.