# üìä Projet Business Intelligence : Analyse Northwind Data Warehouse

Ce Notebook Jupyter utilise les donn√©es charg√©es dans le Data Warehouse `NorthwindDW` (via le script `etl.py`) pour g√©n√©rer les analyses cl√©s avec des graphiques interactifs.

**Outils utilis√©s :**
* **Connexion :** `pyodbc`
* **Manipulation :** `pandas`
* **Visualisation :** `plotly` (graphiques interactifs HTML)
* **Export :** Tous les graphiques sont sauvegard√©s dans le dossier `figures/` au format HTML

---
## 1. Initialisation et Connexion

La premi√®re √©tape consiste √† importer les biblioth√®ques n√©cessaires et √† √©tablir une connexion s√©curis√©e √† l'instance SQL Server. Les graphiques g√©n√©r√©s seront automatiquement sauvegard√©s dans le dossier `figures/`.

In [10]:
import pandas as pd
import pyodbc
import os
import pathlib

# V√©rifier et installer plotly si n√©cessaire
try:
    import plotly.express as px
    import plotly.graph_objects as go
    from plotly.subplots import make_subplots
    print("‚úÖ Plotly import√© avec succ√®s")
except ImportError:
    print("‚ùå Plotly n'est pas install√©. Installation en cours...")
    import subprocess
    import sys
    subprocess.check_call([sys.executable, "-m", "pip", "install", "plotly"])
    import plotly.express as px
    import plotly.graph_objects as go
    from plotly.subplots import make_subplots
    print("‚úÖ Plotly install√© et import√©")

# Configuration de la connexion au Data Warehouse
SQL_DW_SERVER = r'DESKTOP-F8N2M8C\SQLEXPRESS'
SQL_DW_DATABASE = 'NorthwindDW'
SQL_DW_DRIVER = '{ODBC Driver 17 for SQL Server}'

# Cha√Æne de connexion pour l'authentification Windows
SQL_CONN_STRING = (
    f'DRIVER={SQL_DW_DRIVER};'
    f'SERVER={SQL_DW_SERVER};'
    f'DATABASE={SQL_DW_DATABASE};'
    r'Trusted_Connection=yes;'
    r'TrustServerCertificate=yes;'
)

# Cr√©er le dossier figures s'il n'existe pas
# Utiliser un chemin absolu bas√© sur le r√©pertoire du projet
current_dir = pathlib.Path().resolve()
if current_dir.name == 'notebooks':
    PROJECT_ROOT = current_dir.parent
else:
    PROJECT_ROOT = current_dir

FIGURES_DIR = PROJECT_ROOT / 'figures'
FIGURES_DIR.mkdir(exist_ok=True)
FIGURES_DIR = str(FIGURES_DIR)  # Convertir en string pour compatibilit√©

# Initialiser conn √† None pour √©viter les erreurs NameError
conn = None

print(f"Tentative de connexion au Data Warehouse: {SQL_DW_DATABASE}...")
try:
    conn = pyodbc.connect(SQL_CONN_STRING)
    print("‚úÖ Connexion r√©ussie. Le Data Warehouse est pr√™t pour l'analyse.")
    print(f"‚úÖ Dossier de sortie des graphiques: {FIGURES_DIR}")
except pyodbc.Error as e:
    print(f"‚ùå √âchec de la connexion. V√©rifiez le serveur et le pilote : {e}")
    conn = None
except Exception as e:
    print(f"‚ùå Erreur inattendue lors de la connexion : {e}")
    conn = None

# Fonction utilitaire pour v√©rifier la connexion
def check_connection():
    """V√©rifie si la connexion est disponible"""
    try:
        # Dans un notebook Jupyter, on peut acc√©der directement √† conn
        # Cette fonction sera appel√©e depuis le m√™me espace de noms
        if conn is not None:
            return True
        else:
            print("‚ùå Erreur : La connexion √† la base de donn√©es n'est pas √©tablie.")
            print("   Veuillez d'abord ex√©cuter la cellule d'initialisation (Cellule 1).")
            return False
    except NameError:
        print("‚ùå Erreur : La connexion √† la base de donn√©es n'est pas √©tablie.")
        print("   Veuillez d'abord ex√©cuter la cellule d'initialisation (Cellule 1).")
        return False

# Fonction utilitaire pour afficher les graphiques Plotly dans Jupyter
def show_plotly_figure(fig):
    """Affiche un graphique Plotly de mani√®re compatible avec Jupyter"""
    try:
        # Essayer d'utiliser IPython.display pour un meilleur rendu
        from IPython.display import display
        display(fig)
    except ImportError:
        # Si IPython n'est pas disponible, utiliser fig.show() avec gestion d'erreur
        try:
            fig.show()
        except Exception as e:
            print(f"‚ö†Ô∏è  Impossible d'afficher le graphique interactif: {e}")
            print("   Le graphique a √©t√© sauvegard√© en HTML. Ouvrez-le dans un navigateur.")


‚úÖ Plotly import√© avec succ√®s
Tentative de connexion au Data Warehouse: NorthwindDW...
‚úÖ Connexion r√©ussie. Le Data Warehouse est pr√™t pour l'analyse.
‚úÖ Dossier de sortie des graphiques: C:\Users\tk computer\OneDrive\Bureau\etude\BI\Projet_BI_Northwind\figures


---
## 2. Analyse 1 : Tendance des Ventes sur la P√©riode

**Objectif :** √âvaluer la performance globale des ventes (`SalesAmount`) mois par mois afin d'identifier toute croissance, stagnation ou d√©clin.

### **Conclusion :**
Le graphique lin√©aire r√©v√®le une **tendance g√©n√©rale √† la baisse** des revenus sur la p√©riode. Le pic initial est suivi d'une √©rosion progressive, signalant une saturation possible du march√© ou un besoin de r√©√©valuer les strat√©gies commerciales.

In [20]:
if check_connection():
    # Requ√™te: Tendance des ventes mensuelles (utilise FactSales et DimDate)
    query_sales_trend = """
    SELECT 
        DD.Year,
        DD.Month,
        DD.MonthName,
        SUM(FS.SalesAmount) AS MonthlySales,
        COUNT(DISTINCT FS.OrderID) AS TotalOrders
    FROM 
        FactSales FS
    JOIN 
        DimDate DD ON FS.OrderDateKey = DD.DateKey
    GROUP BY 
        DD.Year,
        DD.Month,
        DD.MonthName
    ORDER BY 
        DD.Year,
        DD.Month;
    """

    df_sales_trend = pd.read_sql(query_sales_trend, conn)
    
    # Cr√©ation de la colonne de temps pour l'axe X (Ann√©e-Mois)
    df_sales_trend['YearMonth'] = df_sales_trend['Year'].astype(str) + '-' + df_sales_trend['Month'].astype(str).str.zfill(2)
    df_sales_trend['YearMonthLabel'] = df_sales_trend['MonthName'] + ' ' + df_sales_trend['Year'].astype(str)

    # Visualisation avec Plotly
    fig = px.line(
        df_sales_trend, 
        x='YearMonth', 
        y='MonthlySales',
        markers=True,
        title='Tendance des Ventes Mensuelles (SalesAmount)',
        labels={'MonthlySales': 'Revenus Totaux ($)', 'YearMonth': 'Mois'},
        hover_data=['TotalOrders', 'YearMonthLabel']
    )
    
    fig.update_layout(
        xaxis_title='Mois',
        yaxis_title='Revenus Totaux ($)',
        hovermode='x unified',
        template='plotly_white',
        height=600
    )
    
    fig.update_traces(line=dict(width=3), marker=dict(size=8))
    
    # Sauvegarder en HTML
    output_file = os.path.join(FIGURES_DIR, 'tendance_ventes_mensuelles.html')
    fig.write_html(output_file)
    print(f"‚úÖ Graphique sauvegard√©: {output_file}")
    
    show_plotly_figure(fig)
    
    # Afficher les statistiques
    print(f"\nüìä Statistiques:")
    print(f"   - P√©riode: {df_sales_trend['YearMonth'].min()} √† {df_sales_trend['YearMonth'].max()}")
    print(f"   - CA Total: ${df_sales_trend['MonthlySales'].sum():,.2f}")
    print(f"   - CA Moyen mensuel: ${df_sales_trend['MonthlySales'].mean():,.2f}")
    print(f"   - CA Maximum: ${df_sales_trend['MonthlySales'].max():,.2f} ({df_sales_trend.loc[df_sales_trend['MonthlySales'].idxmax(), 'YearMonthLabel']})")
    print(f"   - CA Minimum: ${df_sales_trend['MonthlySales'].min():,.2f} ({df_sales_trend.loc[df_sales_trend['MonthlySales'].idxmin(), 'YearMonthLabel']})")

‚úÖ Graphique sauvegard√©: C:\Users\tk computer\OneDrive\Bureau\etude\BI\Projet_BI_Northwind\figures\tendance_ventes_mensuelles.html
Figure({
    'data': [{'customdata': array([[22, 'July 1996'],
                                   [25, 'August 1996'],
                                   [23, 'September 1996'],
                                   [26, 'October 1996'],
                                   [25, 'November 1996'],
                                   [31, 'December 1996'],
                                   [33, 'January 1997'],
                                   [29, 'February 1997'],
                                   [30, 'March 1997'],
                                   [31, 'April 1997'],
                                   [32, 'May 1997'],
                                   [30, 'June 1997'],
                                   [33, 'July 1997'],
                                   [33, 'August 1997'],
                                   [37, 'September 1997'],
               


pandas only supports SQLAlchemy connectable (engine/connection) or database string URI or sqlite3 DBAPI2 connection. Other DBAPI2 objects are not tested. Please consider using SQLAlchemy.



---
## 3. Analyse 2 : Performance Commerciale

**Objectif :** Identifier les employ√©s ayant g√©n√©r√© le plus de revenus pour r√©compenser les meilleurs performeurs et analyser leurs m√©thodes de vente.

### **Conclusion :**
Le classement des ventes montre une nette domination de certains employ√©s, notamment **Margaret Peacock** et **Janet Leverling**. La direction devrait examiner de pr√®s leurs zones g√©ographiques et leurs m√©thodes pour reproduire ce succ√®s.

In [19]:
if check_connection():
    # Requ√™te SQL pour agr√©ger les ventes par employ√©
    sql_query_top_employees = """
    SELECT
        de.FirstName + ' ' + de.LastName AS EmployeeName,
        de.Title,
        de.City,
        de.Country,
        SUM(fs.SalesAmount) AS TotalSales,
        COUNT(DISTINCT fs.OrderID) AS TotalOrders,
        AVG(fs.SalesAmount) AS AvgOrderValue
    FROM FactSales fs
    JOIN DimEmployees de ON fs.EmployeeID = de.EmployeeKey
    GROUP BY de.FirstName, de.LastName, de.Title, de.City, de.Country
    ORDER BY TotalSales DESC;
    """

    df_top_employees = pd.read_sql(sql_query_top_employees, conn)

    # --- Visualisation (Graphique √† Barres Horizontal) ---
    fig = px.bar(
        df_top_employees,
        x='TotalSales',
        y='EmployeeName',
        orientation='h',
        title='Performance des Employ√©s (Ventes Totales)',
        labels={'TotalSales': 'Montant des Ventes (USD)', 'EmployeeName': 'Employ√©'},
        hover_data=['TotalOrders', 'AvgOrderValue', 'Title', 'City', 'Country'],
        color='TotalSales',
        color_continuous_scale='Viridis'
    )
    
    fig.update_layout(
        yaxis={'categoryorder': 'total ascending'},
        template='plotly_white',
        height=500,
        showlegend=False
    )
    
    # Sauvegarder en HTML
    output_file = os.path.join(FIGURES_DIR, 'performance_employes.html')
    fig.write_html(output_file)
    print(f"‚úÖ Graphique sauvegard√©: {output_file}")
    
    show_plotly_figure(fig)

    print(f"\nüìä Top 3 des employ√©s:")
    for i in range(min(3, len(df_top_employees))):
        emp = df_top_employees.iloc[i]
        print(f"   {i+1}. {emp['EmployeeName']}: ${emp['TotalSales']:,.2f} ({emp['TotalOrders']} commandes)")

‚úÖ Graphique sauvegard√©: C:\Users\tk computer\OneDrive\Bureau\etude\BI\Projet_BI_Northwind\figures\performance_employes.html
Figure({
    'data': [{'customdata': array([[156, 554.5020136574494, 'Sales Representative', 'Redmond', 'USA'],
                                   [127, 631.8157098173759, 'Sales Representative', 'Kirkland', 'USA'],
                                   [123, 556.8336358570355, 'Sales Representative', 'Seattle', 'USA'],
                                   [96, 691.0280283609237, 'Vice President, Sales', 'Tacoma', 'USA'],
                                   [104, 487.9318361787849, 'Inside Sales Coordinator', 'Seattle', 'USA'],
                                   [72, 707.7740614455912, 'Sales Representative', 'London', 'UK'],
                                   [43, 722.5052934815845, 'Sales Representative', 'London', 'UK'],
                                   [67, 439.95910376836486, 'Sales Representative', 'London', 'UK'],
                                   [42, 587.


pandas only supports SQLAlchemy connectable (engine/connection) or database string URI or sqlite3 DBAPI2 connection. Other DBAPI2 objects are not tested. Please consider using SQLAlchemy.



---
## 4. Analyse 3 : Distribution du Volume de Ventes par Cat√©gorie

**Objectif :** Comprendre sur quelles cat√©gories de produits se concentre la majorit√© des commandes et des articles vendus (`OrderQuantity`).

### **Conclusion :**
Le diagramme circulaire confirme que quelques cat√©gories (typiquement **Seafood** et **Dairy Products**) repr√©sentent une part disproportionn√©e du volume total. Une strat√©gie marketing et d'approvisionnement devrait se concentrer davantage sur ces segments cl√©s pour maximiser le potentiel de croissance.

In [21]:
if check_connection():
    # Requ√™te: Distribution du volume de commandes par Cat√©gorie de Produit
    query_category_volume = """
    SELECT 
        DP.CategoryName,
        SUM(FS.OrderQuantity) AS TotalQuantity,
        SUM(FS.SalesAmount) AS TotalSales,
        COUNT(DISTINCT FS.OrderID) AS TotalOrders,
        COUNT(DISTINCT FS.ProductID) AS TotalProducts
    FROM 
        FactSales FS
    JOIN 
        DimProducts DP ON FS.ProductID = DP.ProductKey
    GROUP BY 
        DP.CategoryName
    ORDER BY 
        TotalQuantity DESC;
    """

    df_category_volume = pd.read_sql(query_category_volume, conn)
    
    # Calcul du pourcentage
    df_category_volume['Percentage'] = (df_category_volume['TotalQuantity'] / df_category_volume['TotalQuantity'].sum() * 100).round(2)
    
    # Visualisation (Diagramme Circulaire)
    fig = px.pie(
        df_category_volume,
        values='TotalQuantity',
        names='CategoryName',
        title='Distribution du Volume de Commandes par Cat√©gorie',
        hover_data=['TotalSales', 'TotalOrders', 'TotalProducts', 'Percentage'],
        labels={'TotalQuantity': 'Quantit√© Totale', 'CategoryName': 'Cat√©gorie'}
    )
    
    fig.update_traces(
        textposition='inside',
        textinfo='percent+label',
        hovertemplate='<b>%{label}</b><br>' +
                      'Quantit√©: %{value}<br>' +
                      'Pourcentage: %{percent}<br>' +
                      'CA Total: $%{customdata[0]:,.2f}<br>' +
                      'Commandes: %{customdata[1]}<br>' +
                      'Produits: %{customdata[2]}<extra></extra>'
    )
    
    fig.update_layout(
        template='plotly_white',
        height=700,
        showlegend=True
    )
    
    # Sauvegarder en HTML
    output_file = os.path.join(FIGURES_DIR, 'distribution_categories.html')
    fig.write_html(output_file)
    print(f"‚úÖ Graphique sauvegard√©: {output_file}")
    
    show_plotly_figure(fig)
    
    # Graphique suppl√©mentaire : Barres pour comparaison
    fig2 = px.bar(
        df_category_volume,
        x='CategoryName',
        y=['TotalQuantity', 'TotalSales'],
        title='Comparaison Volume et CA par Cat√©gorie',
        labels={'value': 'Montant', 'CategoryName': 'Cat√©gorie', 'variable': 'Type'},
        barmode='group',
        hover_data=['TotalOrders', 'TotalProducts']
    )
    
    fig2.update_layout(
        xaxis_title='Cat√©gorie',
        yaxis_title='Montant',
        template='plotly_white',
        height=600
    )
    
    output_file2 = os.path.join(FIGURES_DIR, 'comparaison_categories.html')
    fig2.write_html(output_file2)
    print(f"‚úÖ Graphique sauvegard√©: {output_file2}")
    
    show_plotly_figure(fig2)
    
    print(f"\nüìä Top 3 cat√©gories par volume:")
    for i in range(min(3, len(df_category_volume))):
        cat = df_category_volume.iloc[i]
        print(f"   {i+1}. {cat['CategoryName']}: {cat['TotalQuantity']} unit√©s ({cat['Percentage']}%) - CA: ${cat['TotalSales']:,.2f}")


pandas only supports SQLAlchemy connectable (engine/connection) or database string URI or sqlite3 DBAPI2 connection. Other DBAPI2 objects are not tested. Please consider using SQLAlchemy.



‚úÖ Graphique sauvegard√©: C:\Users\tk computer\OneDrive\Bureau\etude\BI\Projet_BI_Northwind\figures\distribution_categories.html
Figure({
    'data': [{'customdata': {'bdata': ('x7wOuHBZEEEAAAAAACB2QAAAAAAAAC' ... 'AAIGBAAAAAAAAAFEBSuB6F61EXQA=='),
                             'dtype': 'f8',
                             'shape': '8, 4'},
              'domain': {'x': [0.0, 1.0], 'y': [0.0, 1.0]},
              'hovertemplate': ('<b>%{label}</b><br>Quantit√©: %' ... '{customdata[2]}<extra></extra>'),
              'labels': array(['Beverages', 'Dairy Products', 'Confections', 'Seafood', 'Condiments',
                               'Grains/Cereals', 'Meat/Poultry', 'Produce'], dtype=object),
              'legendgroup': '',
              'name': '',
              'showlegend': True,
              'textinfo': 'percent+label',
              'textposition': 'inside',
              'type': 'pie',
              'values': {'bdata': ('AAAAAACewkAAAAAAgN7BQAAAAAAA4r' ... 'AA0rFAAAAAAABnsEAAAAAA

---
## 4. Analyse 4 : Ventes par Pays

**Objectif :** Identifier les pays g√©n√©rant le plus de revenus pour optimiser les strat√©gies de distribution et de marketing g√©ographique.

### **Conclusion :**
L'analyse g√©ographique r√©v√®le une concentration des ventes dans certains pays. Cette information est cruciale pour cibler les march√©s les plus rentables et d√©velopper des strat√©gies sp√©cifiques par r√©gion.


In [22]:
if check_connection():
    # Requ√™te: V√©rification du nombre total de transactions et du CA total
    query_verification = """
    SELECT
        COUNT(DISTINCT OrderID) AS TotalOrders,
        COUNT(SalesAmount) AS TotalOrderDetails,
        SUM(SalesAmount) AS TotalRevenue,
        AVG(SalesAmount) AS AvgOrderValue,
        MIN(OrderDateKey) AS FirstOrderDateKey,
        MAX(OrderDateKey) AS LastOrderDateKey
    FROM
        FactSales;
    """

    df_verification = pd.read_sql(query_verification, conn)
    
    # Affichage des r√©sultats
    print("\n" + "="*60)
    print("üìä DONN√âES DE FACTSALES APR√àS CONSOLIDATION (SQL + Access)")
    print("="*60)
    print(df_verification.to_string(index=False))
    print("="*60)


üìä DONN√âES DE FACTSALES APR√àS CONSOLIDATION (SQL + Access)
 TotalOrders  TotalOrderDetails  TotalRevenue  AvgOrderValue  FirstOrderDateKey  LastOrderDateKey
         830               2155  1.265793e+06      587.37496         19960704.0        19980506.0



üìä DONN√âES DE FACTSALES APR√àS CONSOLIDATION (SQL + Access)
 TotalOrders  TotalOrderDetails  TotalRevenue  AvgOrderValue  FirstOrderDateKey  LastOrderDateKey
         830               2155  1.265793e+06      587.37496         19960704.0        19980506.0



pandas only supports SQLAlchemy connectable (engine/connection) or database string URI or sqlite3 DBAPI2 connection. Other DBAPI2 objects are not tested. Please consider using SQLAlchemy.



In [23]:
if check_connection():
    # Analyse 4: Ventes par Pays (Top 10)
    query_sales_by_country = """
    SELECT 
        DC.CustomerCountry AS Country,
        SUM(FS.SalesAmount) AS TotalSales,
        COUNT(DISTINCT FS.OrderID) AS TotalOrders,
        COUNT(DISTINCT DC.CustomerKey) AS TotalCustomers,
        AVG(FS.SalesAmount) AS AvgOrderValue
    FROM 
        FactSales FS
    JOIN 
        DimCustomers DC ON FS.CustomerID = DC.CustomerKey
    GROUP BY 
        DC.CustomerCountry
    ORDER BY 
        TotalSales DESC;
    """
    
    df_sales_country = pd.read_sql(query_sales_by_country, conn)
    
    # Visualisation
    fig = px.bar(
        df_sales_country.head(10),
        x='Country',
        y='TotalSales',
        title='Top 10 Pays par Chiffre d\'Affaires',
        labels={'TotalSales': 'CA Total ($)', 'Country': 'Pays'},
        hover_data=['TotalOrders', 'TotalCustomers', 'AvgOrderValue'],
        color='TotalSales',
        color_continuous_scale='Blues'
    )
    
    fig.update_layout(
        xaxis_title='Pays',
        yaxis_title='Chiffre d\'Affaires ($)',
        template='plotly_white',
        height=600
    )
    
    output_file = os.path.join(FIGURES_DIR, 'ventes_par_pays.html')
    fig.write_html(output_file)
    print(f"‚úÖ Graphique sauvegard√©: {output_file}")
    
    show_plotly_figure(fig)
    
    print(f"\nüìä Top 5 pays par CA:")
    for i in range(min(5, len(df_sales_country))):
        country = df_sales_country.iloc[i]
        print(f"   {i+1}. {country['Country']}: ${country['TotalSales']:,.2f} ({country['TotalOrders']} commandes, {country['TotalCustomers']} clients)")

‚úÖ Graphique sauvegard√©: C:\Users\tk computer\OneDrive\Bureau\etude\BI\Projet_BI_Northwind\figures\ventes_par_pays.html
Figure({
    'data': [{'customdata': {'bdata': ('AAAAAACAXkAAAAAAAAAqQP/dD+p3zY' ... 'AAAAAAM0AAAAAAAADwPySGQ+rNZYxA'),
                             'dtype': 'f8',
                             'shape': '10, 3'},
              'hovertemplate': ('Pays=%{x}<br>CA Total ($)=%{ma' ... '{customdata[2]}<extra></extra>'),
              'legendgroup': '',
              'marker': {'color': {'bdata': ('PtHV4YT6DUHyNPAQZRwMQf5rtWk9QP' ... 'Z65JvqQM4CPUeJguhARwdS9Xxn6EA='),
                                   'dtype': 'f8'},
                         'coloraxis': 'coloraxis',
                         'pattern': {'shape': ''}},
              'name': '',
              'orientation': 'v',
              'showlegend': False,
              'textposition': 'auto',
              'type': 'bar',
              'x': array(['USA', 'Germany', 'Austria', 'Brazil', 'France', 'UK', 'Venezuela',
  


pandas only supports SQLAlchemy connectable (engine/connection) or database string URI or sqlite3 DBAPI2 connection. Other DBAPI2 objects are not tested. Please consider using SQLAlchemy.



---
## 5. Analyse 5 : √âtat des Livraisons

**Objectif :** Analyser le taux de livraison pour identifier les probl√®mes logistiques et am√©liorer la satisfaction client.

### **Conclusion :**
Le suivi des livraisons permet d'identifier les retards et d'optimiser les processus logistiques. Un taux de livraison √©lev√© est essentiel pour maintenir la satisfaction client et la r√©putation de l'entreprise.


In [24]:
if check_connection():
    # Analyse 5: √âtat des Livraisons
    query_shipping_status = """
    SELECT 
        CASE 
            WHEN FS.ShippedDateKey IS NULL THEN 'Non Livr√©'
            ELSE 'Livr√©'
        END AS ShippingStatus,
        COUNT(*) AS OrderCount,
        SUM(FS.SalesAmount) AS TotalSales,
        COUNT(DISTINCT FS.OrderID) AS UniqueOrders
    FROM 
        FactSales FS
    GROUP BY 
        CASE 
            WHEN FS.ShippedDateKey IS NULL THEN 'Non Livr√©'
            ELSE 'Livr√©'
        END;
    """
    
    df_shipping = pd.read_sql(query_shipping_status, conn)
    
    # Graphique en camembert
    fig = px.pie(
        df_shipping,
        values='OrderCount',
        names='ShippingStatus',
        title='√âtat des Livraisons',
        hover_data=['TotalSales', 'UniqueOrders'],
        color_discrete_map={'Livr√©': '#66b3ff', 'Non Livr√©': '#ff9999'}
    )
    
    fig.update_traces(
        textposition='inside',
        textinfo='percent+label',
        hovertemplate='<b>%{label}</b><br>' +
                      'Lignes: %{value}<br>' +
                      'Pourcentage: %{percent}<br>' +
                      'CA Total: $%{customdata[0]:,.2f}<br>' +
                      'Commandes: %{customdata[1]}<extra></extra>'
    )
    
    fig.update_layout(
        template='plotly_white',
        height=600
    )
    
    output_file = os.path.join(FIGURES_DIR, 'etat_livraisons.html')
    fig.write_html(output_file)
    print(f"‚úÖ Graphique sauvegard√©: {output_file}")
    
    show_plotly_figure(fig)
    
    print(f"\nüìä R√©sum√© des livraisons:")
    for _, row in df_shipping.iterrows():
        print(f"   - {row['ShippingStatus']}: {row['OrderCount']} lignes ({row['OrderCount']/df_shipping['OrderCount'].sum()*100:.1f}%) - CA: ${row['TotalSales']:,.2f}")

‚úÖ Graphique sauvegard√©: C:\Users\tk computer\OneDrive\Bureau\etude\BI\Projet_BI_Northwind\figures\etat_livraisons.html
Figure({
    'data': [{'customdata': {'bdata': 'qS6amy/rMkEAAAAAAEiJQC9ewIxbVNlAAAAAAAAANUA=', 'dtype': 'f8', 'shape': '2, 2'},
              'domain': {'x': [0.0, 1.0], 'y': [0.0, 1.0]},
              'hovertemplate': ('<b>%{label}</b><br>Lignes: %{v' ... '{customdata[1]}<extra></extra>'),
              'labels': array(['Livr√©', 'Non Livr√©'], dtype=object),
              'legendgroup': '',
              'name': '',
              'showlegend': True,
              'textinfo': 'percent+label',
              'textposition': 'inside',
              'type': 'pie',
              'values': {'bdata': 'Igh5AA==', 'dtype': 'i2'}}],
    'layout': {'height': 600, 'legend': {'tracegroupgap': 0}, 'template': '...', 'title': {'text': '√âtat des Livraisons'}}
})

üìä R√©sum√© des livraisons:
   - Livr√©: 2082 lignes (94.5%) - CA: $1,239,855.61
   - Non Livr√©: 121 lignes (5.5%) 


pandas only supports SQLAlchemy connectable (engine/connection) or database string URI or sqlite3 DBAPI2 connection. Other DBAPI2 objects are not tested. Please consider using SQLAlchemy.



---
## 6. Analyse 6 : Top Produits

**Objectif :** Identifier les produits les plus performants en termes de chiffre d'affaires pour optimiser l'inventaire et les strat√©gies de promotion.

### **Conclusion :**
L'identification des produits stars permet de concentrer les efforts marketing et d'optimiser la gestion des stocks. Ces produits g√©n√®rent une part significative du chiffre d'affaires et m√©ritent une attention particuli√®re.


In [25]:
if check_connection():
    # Analyse 6: Top 10 Produits les plus vendus
    query_top_products = """
    SELECT 
        DP.ProductName,
        DP.CategoryName,
        SUM(FS.OrderQuantity) AS TotalQuantity,
        SUM(FS.SalesAmount) AS TotalSales,
        COUNT(DISTINCT FS.OrderID) AS TotalOrders,
        AVG(FS.SaleUnitPrice) AS AvgPrice
    FROM 
        FactSales FS
    JOIN 
        DimProducts DP ON FS.ProductID = DP.ProductKey
    GROUP BY 
        DP.ProductName, DP.CategoryName
    ORDER BY 
        TotalSales DESC;
    """
    
    df_top_products = pd.read_sql(query_top_products, conn)
    
    # Visualisation
    fig = px.bar(
        df_top_products.head(10),
        x='TotalSales',
        y='ProductName',
        orientation='h',
        title='Top 10 Produits par Chiffre d\'Affaires',
        labels={'TotalSales': 'CA Total ($)', 'ProductName': 'Produit'},
        hover_data=['TotalQuantity', 'TotalOrders', 'CategoryName', 'AvgPrice'],
        color='TotalSales',
        color_continuous_scale='Greens'
    )
    
    fig.update_layout(
        yaxis={'categoryorder': 'total ascending'},
        template='plotly_white',
        height=600,
        showlegend=False
    )
    
    output_file = os.path.join(FIGURES_DIR, 'top_produits.html')
    fig.write_html(output_file)
    print(f"‚úÖ Graphique sauvegard√©: {output_file}")
    
    show_plotly_figure(fig)
    
    print(f"\nüìä Top 5 produits par CA:")
    for i in range(min(5, len(df_top_products))):
        prod = df_top_products.iloc[i]
        print(f"   {i+1}. {prod['ProductName']} ({prod['CategoryName']}): ${prod['TotalSales']:,.2f} ({prod['TotalQuantity']} unit√©s)")

‚úÖ Graphique sauvegard√©: C:\Users\tk computer\OneDrive\Bureau\etude\BI\Projet_BI_Northwind\figures\top_produits.html
Figure({
    'data': [{'customdata': array([[623.0, 24, 'Beverages', 245.9333333333333],
                                   [746.0, 32, 'Meat/Poultry', 116.04312499999997],
                                   [1496.0, 54, 'Dairy Products', 51.129629629629626],
                                   [1083.0, 48, 'Confections', 46.41249999999999],
                                   [1577.0, 51, 'Dairy Products', 32.13333333333333],
                                   [1263.0, 50, 'Grains/Cereals', 35.416],
                                   [886.0, 39, 'Produce', 50.55384615384615],
                                   [978.0, 37, 'Meat/Poultry', 36.47027027027027],
                                   [539.0, 27, 'Seafood', 59.72222222222222],
                                   [640.0, 33, 'Produce', 41.975757575757555]], dtype=object),
              'hovertemplate': ('CA Total (


pandas only supports SQLAlchemy connectable (engine/connection) or database string URI or sqlite3 DBAPI2 connection. Other DBAPI2 objects are not tested. Please consider using SQLAlchemy.



---
## 7. R√©sum√© des Analyses

Toutes les analyses ont √©t√© effectu√©es et les graphiques interactifs ont √©t√© sauvegard√©s dans le dossier `figures/` au format HTML.

### Graphiques g√©n√©r√©s :
1. **tendance_ventes_mensuelles.html** - Tendance des ventes mensuelles
2. **performance_employes.html** - Performance des employ√©s
3. **distribution_categories.html** - Distribution par cat√©gorie (camembert)
4. **comparaison_categories.html** - Comparaison volume et CA par cat√©gorie
5. **ventes_par_pays.html** - Top 10 pays par CA
6. **etat_livraisons.html** - √âtat des livraisons
7. **top_produits.html** - Top 10 produits les plus vendus

Tous les graphiques sont interactifs et peuvent √™tre ouverts dans un navigateur web. Ils sont pr√™ts √† √™tre int√©gr√©s au Rapport Final de Projet (PDF) et √† la vid√©o de pr√©sentation.

In [26]:
if check_connection():
    conn.close()
    print("\n" + "="*60)
    print("‚úÖ ANALYSES TERMIN√âES")
    print("="*60)
    print(f"‚úÖ Tous les graphiques ont √©t√© sauvegard√©s dans: {FIGURES_DIR}")
    print("‚úÖ Connexion SQL Server ferm√©e.")
    print("="*60)


‚úÖ ANALYSES TERMIN√âES
‚úÖ Tous les graphiques ont √©t√© sauvegard√©s dans: C:\Users\tk computer\OneDrive\Bureau\etude\BI\Projet_BI_Northwind\figures
‚úÖ Connexion SQL Server ferm√©e.
