In [None]:
# Cellule 1 : Imports
import pandas as pd
import os
import matplotlib.pyplot as plt
import seaborn as sns

# Configuration pour afficher toutes les colonnes
pd.set_option('display.max_columns', None)

# Définition du chemin vers les données brutes
raw_path = '../data/raw/'

# Cellule 2 : Chargement des données
print("Chargement des fichiers CSV bruts...")
try:
    df_orders = pd.read_csv(os.path.join(raw_path, 'Orders.csv'))
    df_details = pd.read_csv(os.path.join(raw_path, 'Order_Details.csv')) # ou 'Order Details.csv' selon votre extraction
    df_customers = pd.read_csv(os.path.join(raw_path, 'Customers.csv'))
    df_employees = pd.read_csv(os.path.join(raw_path, 'Employees.csv'))
    print("✅ Fichiers chargés avec succès.")
except FileNotFoundError as e:
    print(f"❌ Erreur : {e}. Assurez-vous d'avoir lancé extract_data.py avant.")

# Cellule 3 : Aperçu de la table Orders
print("=== ORDERS : Aperçu ===")
display(df_orders.head())
print(df_orders.info())

# Cellule 4 : Vérification des valeurs manquantes (Nulls)
print("=== Valeurs manquantes dans Orders ===")
missing_vals = df_orders.isnull().sum()
print(missing_vals[missing_vals > 0])

# Visualisation simple des dates d'envoi manquantes (Commandes non livrées)
plt.figure(figsize=(6,4))
sns.heatmap(df_orders.isnull(), cbar=False, cmap='viridis')
plt.title("Carte des valeurs manquantes (Jaune = Null)")
plt.show()

# Cellule 5 : Statistiques sur les détails de commande
print("=== ORDER DETAILS : Statistiques ===")
display(df_details.describe())

# Cellule 6 : Aperçu des Clients et Employés
print("=== CLIENTS (Top 5) ===")
display(df_customers.head())

print("=== EMPLOYES (Top 5) ===")
display(df_employees.head())