In [None]:
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
import sqlalchemy
import os

# 1. Connexion Base de donn√©es
db_path = os.path.abspath('../data/warehouse/northwind_dwh.db')
engine = sqlalchemy.create_engine(f'sqlite:///{db_path}')
print(f"‚úÖ Connexion : {db_path}")

# ==============================================================================
# √âTAPE CL√â : D√âTECTION AUTOMATIQUE DES COLONNES
# ==============================================================================
def get_valid_columns(table_name, engine):
    try:
        # On lit juste les ent√™tes (LIMIT 0)
        return pd.read_sql(f"SELECT * FROM {table_name} LIMIT 0", engine).columns.tolist()
    except Exception as e:
        print(f"‚ö†Ô∏è Impossible de lire {table_name}: {e}")
        return []

# R√©cup√©rer les colonnes r√©elles de DimClient
client_cols = get_valid_columns('DimClient', engine)
print(f"üîç Colonnes trouv√©es dans DimClient : {client_cols}")

# D√©terminer quelle colonne utiliser pour la G√©ographie (Country, Pays, ou City...)
geo_column = None
possible_geo_names = ['Country', 'Pays', 'Region', 'City', 'Ville']

for col in possible_geo_names:
    if col in client_cols:
        geo_column = col
        break

print(f"üåç Colonne g√©ographique choisie : {geo_column if geo_column else 'AUCUNE (Graphiques g√©o d√©sactiv√©s)'}")

# ==============================================================================
# CONSTRUCTION DE LA REQU√äTE SQL DYNAMIQUE
# ==============================================================================
# On ne s√©lectionne que ce qui existe
sql_geo_part = f", c.{geo_column}" if geo_column else ""

query = f"""
SELECT 
    f.TotalAmount, 
    f.Quantity,
    d.Year, 
    d.MonthName, 
    e.FullName as Employee
    {sql_geo_part}
FROM FactSales f
LEFT JOIN DimDate d ON f.DateKey = d.DateKey
LEFT JOIN DimClient c ON f.CustomerKey = c.CustomerKey
LEFT JOIN DimEmployee e ON f.EmployeeKey = e.EmployeeKey
"""

try:
    df = pd.read_sql(query, engine)
    print("‚úÖ Donn√©es charg√©es avec succ√®s !")
    display(df.head())
except Exception as e:
    print(f"‚ùå Erreur SQL : {e}")
    # Arr√™t du script si la requ√™te √©choue
    raise e

# ==============================================================================
# VISUALISATIONS (KPI & GRAPHIQUES)
# ==============================================================================

# 1. KPI
print("\n--- KPI ---")
print(f"üí∞ Total Ventes : {df['TotalAmount'].sum():,.2f} $")
print(f"üì¶ Nombre Commandes (lignes) : {len(df)}")

# 2. Graphique par Employ√©
print("\n--- Performance Employ√©s ---")
sales_emp = df.groupby('Employee')['TotalAmount'].sum().reset_index()
fig_emp = px.bar(sales_emp, x='Employee', y='TotalAmount', title="Ventes par Employ√©")
fig_emp.show()

# 3. Graphique 3D & Carte (Seulement si une colonne g√©o a √©t√© trouv√©e)
if geo_column:
    print(f"\n--- Analyse G√©ographique (bas√©e sur '{geo_column}') ---")
    
    # Carte
    sales_geo = df.groupby(geo_column)['TotalAmount'].sum().reset_index()
    fig_map = px.choropleth(sales_geo, 
                            locations=geo_column, 
                            locationmode='country names', # Fonctionne mieux si c'est des pays
                            color="TotalAmount", 
                            title=f"Carte des Ventes ({geo_column})")
    fig_map.show()
    
    # 3D
    df_3d = df.groupby(['Year', geo_column, 'Employee']).agg({'TotalAmount': 'sum'}).reset_index()
    fig_3d = px.scatter_3d(df_3d, 
                           x='Year', y=geo_column, z='Employee',
                           size='TotalAmount', color='TotalAmount',
                           title=f"Cube OLAP 3D (Ann√©e x {geo_column} x Employ√©)")
    fig_3d.show()
else:
    print("\n‚ö†Ô∏è Pas de colonne g√©ographique d√©tect√©e (Country/Pays/City). La carte et le graphe 3D sont masqu√©s.")
    print("üí° Conseil : V√©rifiez votre fichier 'Customers.csv' dans data/raw/.")

# 4. Statut Livraison (Depuis RAW car souvent absent du DWH)
try:
    raw_path = '../data/raw/Orders.csv'
    if os.path.exists(raw_path):
        raw_orders = pd.read_csv(raw_path)
        # Gestion des colonnes dates mal nomm√©es
        date_col = 'ShippedDate' if 'ShippedDate' in raw_orders.columns else 'Shipped Date'
        
        if date_col in raw_orders.columns:
            raw_orders['Status'] = raw_orders[date_col].apply(lambda x: 'Non Livr√©e' if pd.isnull(x) else 'Livr√©e')
            fig_pie = px.pie(raw_orders, names='Status', title='Statut des Livraisons')
            fig_pie.show()
except Exception as e:
    print(f"Info: Pas de graphe livraison ({e})")