# üêç Session 13 : SQL depuis Python

## Objectifs de cette session
- Connecter Python √† une base de donn√©es SQLite
- Ex√©cuter des requ√™tes SQL depuis Python
- Utiliser pandas pour analyser les r√©sultats
- Exporter les donn√©es vers diff√©rents formats

---

## 1. Configuration et Imports

Commen√ßons par importer les biblioth√®ques n√©cessaires.

In [None]:
# Imports standard
import sqlite3
import os
from pathlib import Path

# Imports pour analyse de donn√©es
import pandas as pd
import numpy as np

# SQLAlchemy pour connexion base de donn√©es
from sqlalchemy import create_engine

# Configuration pandas pour meilleur affichage
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 100)
pd.set_option('display.width', None)
pd.set_option('display.float_format', '{:.2f}'.format)

print("‚úÖ Imports r√©ussis")
print(f"Version pandas : {pd.__version__}")
print(f"Version numpy : {np.__version__}")

## 2. Connexion √† la Base de Donn√©es

Nous allons nous connecter √† la base `sales.db` cr√©√©e dans les sessions pr√©c√©dentes.

In [None]:
# Chemin vers la base de donn√©es
db_path = '../sql/sales.db'

# V√©rifier que la base existe
if not os.path.exists(db_path):
    print(f"‚ùå Erreur : La base de donn√©es {db_path} n'existe pas.")
    print("Veuillez d'abord cr√©er la base avec le script schema_sales.sql")
else:
    print(f"‚úÖ Base de donn√©es trouv√©e : {db_path}")
    print(f"Taille : {os.path.getsize(db_path) / 1024:.2f} KB")

# Cr√©er une connexion SQLAlchemy
engine = create_engine(f'sqlite:///{db_path}')

print("\n‚úÖ Connexion SQLAlchemy cr√©√©e avec succ√®s")

### 2.1 V√©rifier les tables disponibles

Avant de commencer, v√©rifions quelles tables sont disponibles dans notre base.

In [None]:
# R√©cup√©rer la liste des tables
query_tables = """
SELECT name 
FROM sqlite_master 
WHERE type='table'
ORDER BY name;
"""

tables = pd.read_sql_query(query_tables, engine)
print("üìä Tables disponibles dans la base de donn√©es :")
print(tables)

# Compter le nombre d'enregistrements dans chaque table
print("\nüìà Nombre d'enregistrements par table :")
for table in tables['name']:
    count_query = f"SELECT COUNT(*) as count FROM {table}"
    count = pd.read_sql_query(count_query, engine)['count'][0]
    print(f"  {table:20} : {count:5} enregistrements")

## 3. Requ√™tes SELECT Simples

### 3.1 R√©cup√©rer tous les clients

In [None]:
# Requ√™te simple : r√©cup√©rer tous les clients
query_customers = """
SELECT 
    customer_id,
    first_name,
    last_name,
    email,
    country,
    city
FROM customers
ORDER BY last_name, first_name
LIMIT 10;
"""

df_customers = pd.read_sql_query(query_customers, engine)

print("üë• Les 10 premiers clients :")
print(df_customers)

print(f"\nüìä Forme du DataFrame : {df_customers.shape}")
print(f"Colonnes : {list(df_customers.columns)}")

### 3.2 Statistiques sur les clients

In [None]:
# R√©cup√©rer tous les clients pour faire des statistiques
df_all_customers = pd.read_sql_query("SELECT * FROM customers", engine)

print("üìä Statistiques sur les clients :")
print(f"Nombre total de clients : {len(df_all_customers)}")
print(f"\nR√©partition par pays :")
print(df_all_customers['country'].value_counts())

print(f"\nR√©partition par ville (top 10) :")
print(df_all_customers['city'].value_counts().head(10))

### 3.3 Filtrage avec param√®tres (S√©curit√©)

‚ö†Ô∏è **Important** : Toujours utiliser des param√®tres pour √©viter les injections SQL !

In [None]:
# ‚úÖ BONNE PRATIQUE : Utiliser des param√®tres
country_filter = 'France'

query_filtered = """
SELECT 
    customer_id,
    first_name,
    last_name,
    email,
    city
FROM customers
WHERE country = :country
ORDER BY city, last_name;
"""

df_france = pd.read_sql_query(
    query_filtered, 
    engine, 
    params={'country': country_filter}
)

print(f"üë• Clients en {country_filter} :")
print(df_france.head(10))
print(f"\nüìä Total : {len(df_france)} clients")

## 4. R√©cup√©ration des Produits

Analysons le catalogue de produits.

In [None]:
# R√©cup√©rer tous les produits
query_products = """
SELECT 
    product_id,
    product_name,
    category,
    price,
    stock_quantity
FROM products
ORDER BY category, product_name;
"""

df_products = pd.read_sql_query(query_products, engine)

print("üõçÔ∏è Catalogue de produits :")
print(df_products)

# Statistiques sur les produits
print("\nüìä Statistiques :")
print(f"Nombre total de produits : {len(df_products)}")
print(f"\nProduits par cat√©gorie :")
print(df_products['category'].value_counts())
print(f"\nPrix moyen par cat√©gorie :")
print(df_products.groupby('category')['price'].agg(['mean', 'min', 'max']).round(2))
print(f"\nStock total par cat√©gorie :")
print(df_products.groupby('category')['stock_quantity'].sum())

### 4.1 Produits √† faible stock

Identifions les produits qui n√©cessitent un r√©approvisionnement.

In [None]:
# Produits avec stock inf√©rieur √† 20
low_stock_threshold = 20

query_low_stock = """
SELECT 
    product_id,
    product_name,
    category,
    price,
    stock_quantity
FROM products
WHERE stock_quantity < :threshold
ORDER BY stock_quantity ASC, product_name;
"""

df_low_stock = pd.read_sql_query(
    query_low_stock, 
    engine, 
    params={'threshold': low_stock_threshold}
)

print(f"‚ö†Ô∏è Produits avec stock < {low_stock_threshold} :")
if len(df_low_stock) > 0:
    print(df_low_stock)
else:
    print("‚úÖ Aucun produit en rupture de stock")

## 5. Requ√™tes JOIN : Commandes et Clients

### 5.1 Vue d'ensemble des commandes

In [None]:
# JOIN entre orders et customers
query_orders = """
SELECT 
    o.order_id,
    o.order_date,
    o.total_amount,
    o.status,
    c.customer_id,
    c.first_name,
    c.last_name,
    c.email,
    c.country,
    c.city
FROM orders o
INNER JOIN customers c ON o.customer_id = c.customer_id
ORDER BY o.order_date DESC;
"""

df_orders = pd.read_sql_query(query_orders, engine)

print("üõí Commandes avec informations clients :")
print(df_orders.head(10))

print(f"\nüìä Statistiques g√©n√©rales :")
print(f"Nombre total de commandes : {len(df_orders)}")
print(f"Montant total des ventes : {df_orders['total_amount'].sum():.2f} ‚Ç¨")
print(f"Panier moyen : {df_orders['total_amount'].mean():.2f} ‚Ç¨")
print(f"Panier m√©dian : {df_orders['total_amount'].median():.2f} ‚Ç¨")

### 5.2 Analyse par statut de commande

In [None]:
# Analyse par statut
print("üìä Analyse par statut de commande :")
status_analysis = df_orders.groupby('status').agg({
    'order_id': 'count',
    'total_amount': ['sum', 'mean', 'median']
}).round(2)

status_analysis.columns = ['Nombre', 'Total (‚Ç¨)', 'Moyenne (‚Ç¨)', 'M√©diane (‚Ç¨)']
print(status_analysis)

# Distribution des statuts
print("\nüìà Distribution des statuts :")
print(df_orders['status'].value_counts())

### 5.3 Ventes par pays

In [None]:
# Analyse par pays
print("üåç Ventes par pays :")
country_sales = df_orders.groupby('country').agg({
    'order_id': 'count',
    'customer_id': 'nunique',
    'total_amount': ['sum', 'mean']
}).round(2)

country_sales.columns = ['Nb Commandes', 'Nb Clients', 'CA Total (‚Ç¨)', 'Panier Moyen (‚Ç¨)']
country_sales = country_sales.sort_values('CA Total (‚Ç¨)', ascending=False)
print(country_sales)

### 5.4 Top 10 clients (par montant total)

In [None]:
# Top clients
query_top_customers = """
SELECT 
    c.customer_id,
    c.first_name,
    c.last_name,
    c.email,
    c.country,
    COUNT(o.order_id) as nb_orders,
    SUM(o.total_amount) as total_spent,
    AVG(o.total_amount) as avg_order,
    MAX(o.order_date) as last_order_date
FROM customers c
INNER JOIN orders o ON c.customer_id = o.customer_id
GROUP BY c.customer_id, c.first_name, c.last_name, c.email, c.country
ORDER BY total_spent DESC
LIMIT 10;
"""

df_top_customers = pd.read_sql_query(query_top_customers, engine)

print("üèÜ Top 10 clients (par montant d√©pens√©) :")
print(df_top_customers)

## 6. Analyse D√©taill√©e : Produits Vendus

### 6.1 JOIN complexe sur 4 tables

In [None]:
# Requ√™te complexe : toutes les informations sur les ventes
query_sales_detail = """
SELECT 
    o.order_id,
    o.order_date,
    o.status,
    c.customer_id,
    c.first_name || ' ' || c.last_name as customer_name,
    c.country,
    c.city,
    p.product_id,
    p.product_name,
    p.category,
    oi.quantity,
    oi.unit_price,
    (oi.quantity * oi.unit_price) as line_total
FROM orders o
INNER JOIN customers c ON o.customer_id = c.customer_id
INNER JOIN order_items oi ON o.order_id = oi.order_id
INNER JOIN products p ON oi.product_id = p.product_id
ORDER BY o.order_date DESC, o.order_id, p.product_name;
"""

df_sales = pd.read_sql_query(query_sales_detail, engine)

print("üí∞ D√©tail complet des ventes :")
print(df_sales.head(15))

print(f"\nüìä R√©sum√© :")
print(f"Nombre de lignes de commande : {len(df_sales)}")
print(f"Nombre de commandes uniques : {df_sales['order_id'].nunique()}")
print(f"Nombre de produits diff√©rents vendus : {df_sales['product_id'].nunique()}")
print(f"Montant total des ventes : {df_sales['line_total'].sum():.2f} ‚Ç¨")

### 6.2 Top 10 produits les plus vendus

In [None]:
# Analyser les produits les plus vendus
print("üèÜ Top 10 produits par quantit√© vendue :")
top_products_qty = df_sales.groupby(['product_id', 'product_name', 'category']).agg({
    'quantity': 'sum',
    'line_total': 'sum'
}).round(2)

top_products_qty = top_products_qty.sort_values('quantity', ascending=False).head(10)
top_products_qty.columns = ['Quantit√© Vendue', 'CA Total (‚Ç¨)']
print(top_products_qty)

print("\nüèÜ Top 10 produits par chiffre d'affaires :")
top_products_revenue = df_sales.groupby(['product_id', 'product_name', 'category']).agg({
    'quantity': 'sum',
    'line_total': 'sum'
}).round(2)

top_products_revenue = top_products_revenue.sort_values('line_total', ascending=False).head(10)
top_products_revenue.columns = ['Quantit√© Vendue', 'CA Total (‚Ç¨)']
print(top_products_revenue)

### 6.3 Ventes par cat√©gorie

In [None]:
# Analyse par cat√©gorie de produits
print("üì¶ Ventes par cat√©gorie :")
category_sales = df_sales.groupby('category').agg({
    'order_id': 'count',
    'quantity': 'sum',
    'line_total': 'sum'
}).round(2)

category_sales.columns = ['Nb Lignes', 'Quantit√© Totale', 'CA Total (‚Ç¨)']
category_sales = category_sales.sort_values('CA Total (‚Ç¨)', ascending=False)
print(category_sales)

# Pourcentage par cat√©gorie
print("\nüìä Part de march√© par cat√©gorie :")
category_sales['Part (%)'] = (category_sales['CA Total (‚Ç¨)'] / category_sales['CA Total (‚Ç¨)'].sum() * 100).round(2)
print(category_sales[['CA Total (‚Ç¨)', 'Part (%)']])

## 7. Analyse Temporelle

### 7.1 Conversion des dates et extraction des composantes

In [None]:
# Cr√©er une copie du DataFrame pour l'analyse temporelle
df_time_analysis = df_sales.copy()

# Convertir order_date en datetime
df_time_analysis['order_date'] = pd.to_datetime(df_time_analysis['order_date'])

# Extraire les composantes temporelles
df_time_analysis['year'] = df_time_analysis['order_date'].dt.year
df_time_analysis['month'] = df_time_analysis['order_date'].dt.month
df_time_analysis['month_name'] = df_time_analysis['order_date'].dt.strftime('%B')
df_time_analysis['quarter'] = df_time_analysis['order_date'].dt.quarter
df_time_analysis['day_of_week'] = df_time_analysis['order_date'].dt.day_name()

print("üìÖ Donn√©es avec composantes temporelles :")
print(df_time_analysis[['order_date', 'year', 'month', 'month_name', 'quarter', 'day_of_week', 'line_total']].head(10))

### 7.2 Ventes par mois

In [None]:
# Analyse mensuelle
print("üìÜ Ventes par mois :")
monthly_sales = df_time_analysis.groupby(['year', 'month', 'month_name']).agg({
    'order_id': 'nunique',
    'line_total': 'sum'
}).round(2)

monthly_sales.columns = ['Nb Commandes', 'CA Total (‚Ç¨)']
print(monthly_sales)

### 7.3 Ventes par jour de la semaine

In [None]:
# Analyse par jour de la semaine
print("üìä Ventes par jour de la semaine :")
weekday_sales = df_time_analysis.groupby('day_of_week').agg({
    'order_id': 'nunique',
    'line_total': ['sum', 'mean']
}).round(2)

weekday_sales.columns = ['Nb Commandes', 'CA Total (‚Ç¨)', 'CA Moyen (‚Ç¨)']

# Ordre des jours de la semaine
days_order = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
weekday_sales = weekday_sales.reindex([day for day in days_order if day in weekday_sales.index])

print(weekday_sales)

## 8. Clients Inactifs (LEFT JOIN)

Identifions les clients qui n'ont jamais pass√© de commande.

In [None]:
# LEFT JOIN pour trouver les clients sans commande
query_inactive = """
SELECT 
    c.customer_id,
    c.first_name,
    c.last_name,
    c.email,
    c.country,
    c.created_at,
    COUNT(o.order_id) as nb_orders
FROM customers c
LEFT JOIN orders o ON c.customer_id = o.customer_id
GROUP BY c.customer_id, c.first_name, c.last_name, c.email, c.country, c.created_at
HAVING COUNT(o.order_id) = 0
ORDER BY c.created_at DESC;
"""

df_inactive = pd.read_sql_query(query_inactive, engine)

print("üò¥ Clients inactifs (sans commande) :")
if len(df_inactive) > 0:
    print(df_inactive)
    print(f"\nüìä Total : {len(df_inactive)} clients inactifs")
else:
    print("‚úÖ Tous les clients ont pass√© au moins une commande !")

## 9. Cr√©ation d'une Table d'Analyse

### 9.1 Cr√©er un DataFrame de statistiques clients

In [None]:
# Cr√©er une table d'analyse avec statistiques par client
query_customer_stats = """
SELECT 
    c.customer_id,
    c.first_name,
    c.last_name,
    c.email,
    c.country,
    c.city,
    COUNT(o.order_id) as nb_orders,
    COALESCE(SUM(o.total_amount), 0) as total_spent,
    COALESCE(AVG(o.total_amount), 0) as avg_order,
    COALESCE(MIN(o.total_amount), 0) as min_order,
    COALESCE(MAX(o.total_amount), 0) as max_order,
    MAX(o.order_date) as last_order_date,
    MIN(o.order_date) as first_order_date
FROM customers c
LEFT JOIN orders o ON c.customer_id = o.customer_id
GROUP BY c.customer_id, c.first_name, c.last_name, c.email, c.country, c.city
ORDER BY total_spent DESC;
"""

df_customer_stats = pd.read_sql_query(query_customer_stats, engine)

# Cat√©goriser les clients selon leur activit√©
def categorize_customer(row):
    if row['nb_orders'] == 0:
        return 'Inactif'
    elif row['nb_orders'] == 1:
        return 'Nouveau'
    elif row['total_spent'] < 200:
        return 'Occasionnel'
    elif row['total_spent'] < 500:
        return 'R√©gulier'
    else:
        return 'VIP'

df_customer_stats['segment'] = df_customer_stats.apply(categorize_customer, axis=1)

print("üìä Statistiques par client (top 15) :")
print(df_customer_stats.head(15))

print("\nüìà R√©partition par segment :")
print(df_customer_stats['segment'].value_counts())

### 9.2 Sauvegarder dans une nouvelle table SQL

In [None]:
# Sauvegarder les statistiques dans une nouvelle table
table_name = 'customer_statistics'

try:
    # √âcrire le DataFrame dans la base de donn√©es
    df_customer_stats.to_sql(
        table_name, 
        engine, 
        if_exists='replace',  # Remplacer si existe
        index=False
    )
    
    print(f"‚úÖ Table '{table_name}' cr√©√©e avec succ√®s")
    print(f"   Nombre d'enregistrements : {len(df_customer_stats)}")
    
    # V√©rifier que la table a √©t√© cr√©√©e
    verify_query = f"SELECT COUNT(*) as count FROM {table_name}"
    count = pd.read_sql_query(verify_query, engine)['count'][0]
    print(f"   V√©rification : {count} lignes dans la table")
    
except Exception as e:
    print(f"‚ùå Erreur lors de la cr√©ation de la table : {e}")

## 10. Export des Donn√©es

### 10.1 Export vers CSV

In [None]:
# Cr√©er un dossier pour les exports
export_dir = Path('../data/exports')
export_dir.mkdir(parents=True, exist_ok=True)

# Export des statistiques clients
csv_file = export_dir / 'customer_statistics.csv'
df_customer_stats.to_csv(csv_file, index=False, encoding='utf-8')
print(f"‚úÖ Export CSV : {csv_file}")
print(f"   Taille : {csv_file.stat().st_size / 1024:.2f} KB")

# Export du d√©tail des ventes
csv_sales = export_dir / 'sales_detail.csv'
df_sales.to_csv(csv_sales, index=False, encoding='utf-8')
print(f"‚úÖ Export CSV : {csv_sales}")
print(f"   Taille : {csv_sales.stat().st_size / 1024:.2f} KB")

### 10.2 Export vers JSON

In [None]:
# Export JSON du top 10 clients
json_file = export_dir / 'top_customers.json'
df_top_customers.to_json(json_file, orient='records', indent=2)
print(f"‚úÖ Export JSON : {json_file}")
print(f"   Taille : {json_file.stat().st_size / 1024:.2f} KB")

### 10.3 Cr√©er un rapport HTML

In [None]:
# Cr√©er un rapport HTML simple
html_report = export_dir / 'sales_report.html'

html_content = f"""
<!DOCTYPE html>
<html>
<head>
    <meta charset="UTF-8">
    <title>Rapport de Ventes - Session 13</title>
    <style>
        body {{ font-family: Arial, sans-serif; margin: 20px; }}
        h1 {{ color: #2c3e50; }}
        h2 {{ color: #34495e; border-bottom: 2px solid #3498db; padding-bottom: 5px; }}
        table {{ border-collapse: collapse; width: 100%; margin: 20px 0; }}
        th {{ background-color: #3498db; color: white; padding: 10px; text-align: left; }}
        td {{ padding: 8px; border-bottom: 1px solid #ddd; }}
        tr:hover {{ background-color: #f5f5f5; }}
        .stat-box {{ background: #ecf0f1; padding: 15px; margin: 10px 0; border-radius: 5px; }}
    </style>
</head>
<body>
    <h1>üìä Rapport d'Analyse des Ventes</h1>
    <p><strong>G√©n√©r√© le :</strong> {pd.Timestamp.now().strftime('%Y-%m-%d %H:%M:%S')}</p>
    
    <div class="stat-box">
        <h2>üìà Statistiques Globales</h2>
        <ul>
            <li><strong>Nombre de clients :</strong> {len(df_all_customers)}</li>
            <li><strong>Nombre de commandes :</strong> {len(df_orders)}</li>
            <li><strong>Chiffre d'affaires total :</strong> {df_orders['total_amount'].sum():.2f} ‚Ç¨</li>
            <li><strong>Panier moyen :</strong> {df_orders['total_amount'].mean():.2f} ‚Ç¨</li>
        </ul>
    </div>
    
    <h2>üèÜ Top 10 Clients</h2>
    {df_top_customers.to_html(index=False)}
    
    <h2>üì¶ Ventes par Cat√©gorie</h2>
    {category_sales.to_html()}
    
    <h2>üåç Ventes par Pays</h2>
    {country_sales.to_html()}
</body>
</html>
"""

with open(html_report, 'w', encoding='utf-8') as f:
    f.write(html_content)

print(f"‚úÖ Rapport HTML cr√©√© : {html_report}")
print(f"   Ouvrez le fichier dans votre navigateur pour voir le rapport")

## 11. Fonctions R√©utilisables

Cr√©ons des fonctions pour faciliter les requ√™tes futures.

In [None]:
def get_customers_by_country(country_name, engine):
    """
    R√©cup√®re tous les clients d'un pays donn√©.
    
    Args:
        country_name (str): Nom du pays
        engine: Moteur SQLAlchemy
        
    Returns:
        DataFrame: Clients du pays sp√©cifi√©
    """
    query = """
    SELECT * FROM customers
    WHERE country = :country
    ORDER BY last_name, first_name
    """
    
    try:
        df = pd.read_sql_query(query, engine, params={'country': country_name})
        return df
    except Exception as e:
        print(f"Erreur : {e}")
        return None


def get_order_summary(start_date=None, end_date=None, engine=engine):
    """
    R√©cup√®re un r√©sum√© des commandes sur une p√©riode.
    
    Args:
        start_date (str): Date de d√©but (YYYY-MM-DD)
        end_date (str): Date de fin (YYYY-MM-DD)
        engine: Moteur SQLAlchemy
        
    Returns:
        DataFrame: R√©sum√© des commandes
    """
    query = "SELECT * FROM orders WHERE 1=1"
    params = {}
    
    if start_date:
        query += " AND order_date >= :start_date"
        params['start_date'] = start_date
    
    if end_date:
        query += " AND order_date <= :end_date"
        params['end_date'] = end_date
    
    query += " ORDER BY order_date DESC"
    
    try:
        df = pd.read_sql_query(query, engine, params=params)
        return df
    except Exception as e:
        print(f"Erreur : {e}")
        return None


def get_product_performance(engine):
    """
    Analyse la performance des produits.
    
    Returns:
        DataFrame: Statistiques par produit
    """
    query = """
    SELECT 
        p.product_id,
        p.product_name,
        p.category,
        p.price as current_price,
        COUNT(DISTINCT oi.order_id) as nb_orders,
        SUM(oi.quantity) as total_quantity_sold,
        SUM(oi.quantity * oi.unit_price) as total_revenue,
        AVG(oi.unit_price) as avg_selling_price
    FROM products p
    LEFT JOIN order_items oi ON p.product_id = oi.product_id
    GROUP BY p.product_id, p.product_name, p.category, p.price
    ORDER BY total_revenue DESC;
    """
    
    try:
        df = pd.read_sql_query(query, engine)
        return df
    except Exception as e:
        print(f"Erreur : {e}")
        return None

print("‚úÖ Fonctions cr√©√©es avec succ√®s")
print("   - get_customers_by_country()")
print("   - get_order_summary()")
print("   - get_product_performance()")

### 11.1 Tester les fonctions

In [None]:
# Test : Clients en France
print("Test 1 : Clients en France")
df_france = get_customers_by_country('France', engine)
if df_france is not None:
    print(f"Nombre de clients fran√ßais : {len(df_france)}")
    print(df_france.head())

print("\n" + "="*80 + "\n")

# Test : Performance des produits
print("Test 2 : Performance des produits")
df_product_perf = get_product_performance(engine)
if df_product_perf is not None:
    print(df_product_perf.head(10))

print("\n" + "="*80 + "\n")

# Test : Commandes en 2024
print("Test 3 : Commandes en 2024")
df_2024 = get_order_summary(start_date='2024-01-01', end_date='2024-12-31', engine=engine)
if df_2024 is not None:
    print(f"Nombre de commandes en 2024 : {len(df_2024)}")
    print(f"CA total 2024 : {df_2024['total_amount'].sum():.2f} ‚Ç¨")

## 12. R√©sum√© et Bonnes Pratiques

### ‚úÖ Ce que nous avons appris

1. **Connexion √† SQLite** avec `sqlite3` et `SQLAlchemy`
2. **Ex√©cution de requ√™tes** SELECT avec `pandas.read_sql_query()`
3. **Requ√™tes param√©tr√©es** pour la s√©curit√© (√©viter les injections SQL)
4. **JOIN complexes** sur plusieurs tables
5. **Analyse de donn√©es** avec pandas apr√®s extraction SQL
6. **Cr√©ation de tables** avec `to_sql()`
7. **Export de donn√©es** vers CSV, JSON, HTML
8. **Fonctions r√©utilisables** pour faciliter les requ√™tes

### üéØ Bonnes Pratiques

#### S√©curit√©
- ‚úÖ Toujours utiliser des **param√®tres** dans les requ√™tes
- ‚ùå Ne jamais concat√©ner des variables dans le SQL

#### Performance
- ‚úÖ Privil√©gier **une requ√™te JOIN** plut√¥t que plusieurs requ√™tes
- ‚úÖ Utiliser **LIMIT** quand vous testez
- ‚úÖ Cr√©er des **index** sur les colonnes utilis√©es dans WHERE/JOIN

#### Organisation
- ‚úÖ Fermer les connexions (ou utiliser context managers)
- ‚úÖ G√©rer les erreurs avec **try/except**
- ‚úÖ Cr√©er des **fonctions r√©utilisables**
- ‚úÖ Documenter le code avec des **docstrings**

#### Analyse
- ‚úÖ Utiliser **pandas** pour transformer et analyser
- ‚úÖ Convertir les dates avec `pd.to_datetime()`
- ‚úÖ Utiliser `groupby()` pour les agr√©gations

### üìö Ressources

- [Documentation pandas.read_sql_query](https://pandas.pydata.org/docs/reference/api/pandas.read_sql_query.html)
- [Documentation SQLAlchemy](https://docs.sqlalchemy.org/)
- [Python sqlite3](https://docs.python.org/3/library/sqlite3.html)

## üéì Exercices √† Faire

### Exercice 1 : Analyse RFM (Recency, Frequency, Monetary)

Cr√©ez une analyse RFM des clients :
- **R** (Recency) : Nombre de jours depuis la derni√®re commande
- **F** (Frequency) : Nombre de commandes
- **M** (Monetary) : Montant total d√©pens√©

Segmentez les clients en fonction de ces crit√®res.

### Exercice 2 : Rapport de Ventes Mensuel

Cr√©ez un rapport qui affiche pour chaque mois :
- Nombre de commandes
- Chiffre d'affaires
- Nombre de nouveaux clients
- Panier moyen

### Exercice 3 : Analyse de Panier

Identifiez les produits fr√©quemment achet√©s ensemble (market basket analysis).

### Exercice 4 : Dashboard de Ventes

Cr√©ez un rapport HTML interactif avec :
- KPIs principaux
- Tableaux de synth√®se
- Top produits/clients
- Analyse temporelle

---

**Bravo !** Vous ma√Ætrisez maintenant l'int√©gration de SQL et Python ! üéâ