# Tableaux de bord

Ce notebook propose des visualisations avancées et des indicateurs de performance pour le projet BI.

In [None]:
import os
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Créer le dossier d'export si nécessaire
os.makedirs('../generated/graphs', exist_ok=True)

faits_matieres = pd.read_csv('../generated/faits_matieres.csv')

plt.figure(figsize=(12,6))
sns.barplot(data=faits_matieres, x='type_matiere', y='volume_tonnes', estimator=sum)
plt.xticks(rotation=45)
plt.title('Volume total par type de matière')
plt.tight_layout()
plt.savefig('../generated/graphs/volume_par_type_matiere.png')
plt.show()

In [None]:
# KPI : Volume total par producteur
total_volume_producteur = faits_matieres.groupby('producteur')['volume_tonnes'].sum().sort_values(ascending=False)
print("Volume total par producteur :")
print(total_volume_producteur)

plt.figure(figsize=(10,5))
sns.barplot(x=total_volume_producteur.index, y=total_volume_producteur.values)
plt.xticks(rotation=45)
plt.title('Volume total par producteur')
plt.tight_layout()
plt.savefig('../generated/graphs/volume_par_producteur.png')
plt.show()

# KPI : Volume total par période
total_volume_periode = faits_matieres.groupby('periode')['volume_tonnes'].sum().sort_values(ascending=False)
print("Volume total par période :")
print(total_volume_periode)

plt.figure(figsize=(8,4))
sns.barplot(x=total_volume_periode.index, y=total_volume_periode.values)
plt.title('Volume total par période')
plt.tight_layout()
plt.savefig('../generated/graphs/volume_par_periode.png')
plt.show()

# KPI : Top 5 types de matières par volume
top5_matieres = faits_matieres.groupby('type_matiere')['volume_tonnes'].sum().sort_values(ascending=False).head(5)
print("Top 5 types de matières par volume :")
print(top5_matieres)

plt.figure(figsize=(8,4))
sns.barplot(x=top5_matieres.index, y=top5_matieres.values)
plt.title('Top 5 types de matières par volume')
plt.tight_layout()
plt.savefig('../generated/graphs/top5_types_matiere.png')
plt.show()

# Heatmap : Volume par type de matière et producteur
pivot = faits_matieres.pivot_table(index='type_matiere', columns='producteur', values='volume_tonnes', aggfunc='sum', fill_value=0)
plt.figure(figsize=(12,8))
sns.heatmap(pivot, annot=True, fmt='.0f', cmap='Blues')
plt.title('Volume par type de matière et producteur')
plt.tight_layout()
plt.savefig('../generated/graphs/heatmap_volume_type_producteur.png')
plt.show()

In [None]:
# Évolution du volume par type de matière au fil des années
plt.figure(figsize=(12,6))
sns.lineplot(data=faits_matieres, x='periode', y='volume_tonnes', hue='type_matiere', marker='o')
plt.title('Évolution du volume par type de matière')
plt.tight_layout()
plt.savefig('../generated/graphs/evolution_volume_type_matiere.png')
plt.show()

# Répartition (%) par type de matière (pie chart)
volumes = faits_matieres.groupby('type_matiere')['volume_tonnes'].sum()
plt.figure(figsize=(8,8))
plt.pie(volumes, labels=volumes.index, autopct='%1.1f%%', startangle=140)
plt.title('Répartition du volume par type de matière')
plt.savefig('../generated/graphs/repartition_volume_type_matiere.png')
plt.show()

# Volume moyen par producteur et par type de matière
mean_volume_producteur = faits_matieres.groupby('producteur')['volume_tonnes'].mean().sort_values(ascending=False)
mean_volume_matiere = faits_matieres.groupby('type_matiere')['volume_tonnes'].mean().sort_values(ascending=False)
print('Volume moyen par producteur:')
print(mean_volume_producteur)
print('Volume moyen par type de matière:')
print(mean_volume_matiere)

# Top 3 producteurs par type de matière
top_producteurs_par_matiere = faits_matieres.groupby(['type_matiere', 'producteur'])['volume_tonnes'].sum().reset_index()
top3 = top_producteurs_par_matiere.groupby('type_matiere').apply(lambda x: x.nlargest(3, 'volume_tonnes')).reset_index(drop=True)
print('Top 3 producteurs par type de matière:')
print(top3)

# Analyse des valeurs manquantes et outliers
print('Valeurs manquantes par colonne:')
print(faits_matieres.isnull().sum())
plt.figure(figsize=(10,4))
sns.boxplot(data=faits_matieres, x='type_matiere', y='volume_tonnes')
plt.xticks(rotation=45)
plt.title('Détection des outliers par type de matière')
plt.tight_layout()
plt.savefig('../generated/graphs/outliers_type_matiere.png')
plt.show()

# Tableau interactif (si Jupyter/IPython)
from IPython.display import display
print('Aperçu interactif des faits:')
display(faits_matieres.head(20))