In [1]:
# Cellule 1 : Installation des packages
print("Installation des packages n√©cessaires...")

# Liste des packages √† installer
packages = [
    "earthengine-api",  # Pour Google Earth Engine
    "pandas",           # Pour les donn√©es tabulaires
    "numpy",            # Pour les calculs num√©riques
    "matplotlib",       # Pour les graphiques
    "geemap"            # Facultatif : pour les cartes interactives
]

# Installer chaque package
import subprocess
import sys

for package in packages:
    try:
        # V√©rifier si d√©j√† install√©
        __import__(package.replace("-", "_"))
        print(f"‚úì {package} est d√©j√† install√©")
    except ImportError:
        print(f"Installation de {package}...")
        subprocess.check_call([sys.executable, "-m", "pip", "install", package])
        print(f"‚úì {package} install√© avec succ√®s")

print("\nInstallation termin√©e !")


Installation des packages n√©cessaires...
Installation de earthengine-api...
‚úì earthengine-api install√© avec succ√®s
‚úì pandas est d√©j√† install√©
‚úì numpy est d√©j√† install√©
‚úì matplotlib est d√©j√† install√©
‚úì geemap est d√©j√† install√©

Installation termin√©e !


In [3]:
# Cellule 2 : Import des biblioth√®ques
print("Importation des biblioth√®ques...")

# 1. Google Earth Engine
try:
    import ee
    print("‚úì Google Earth Engine import√©")
except Exception as e:
    print(f"‚úó Erreur avec Google Earth Engine: {e}")

# 2. Analyse de donn√©es
try:
    import pandas as pd
    print("‚úì pandas import√© (pour les tableaux)")
except Exception as e:
    print(f"‚úó Erreur avec pandas: {e}")

# 3. Calcul num√©rique
try:
    import numpy as np
    print("‚úì numpy import√© (pour les calculs)")
except Exception as e:
    print(f"‚úó Erreur avec numpy: {e}")

# 4. Visualisation
try:
    import matplotlib.pyplot as plt
    print("‚úì matplotlib import√© (pour les graphiques)")
except Exception as e:
    print(f"‚úó Erreur avec matplotlib: {e}")

print("\nToutes les biblioth√®ques sont import√©es !")

Importation des biblioth√®ques...
‚úì Google Earth Engine import√©
‚úì pandas import√© (pour les tableaux)
‚úì numpy import√© (pour les calculs)
‚úì matplotlib import√© (pour les graphiques)

Toutes les biblioth√®ques sont import√©es !


In [5]:
# Cellule 3 : Initialisation avec TON projet
print("INITIALISATION AVEC TON PROJET GEE")
print("=" * 60)

# Ton project ID exact
TON_PROJET = "userscheikhthioub501"  # Ton projet
print(f"Project ID utilis√© : {TON_PROJET}")

print("\n√âtape 1 : Importation de Google Earth Engine...")
import ee

print("√âtape 2 : Initialisation...")
try:
    # Initialiser avec TON projet
    ee.Initialize(project=TON_PROJET)
    print("‚úì SUCC√àS ! Google Earth Engine est initialis√©")
    print(f"‚úì Projet utilis√© : {TON_PROJET}")
    
except Exception as e:
    print(f"‚úó ERREUR : {e}")
    print("\nEssayons sans sp√©cifier de projet...")
    try:
        ee.Initialize()
        print("‚úì SUCC√àS avec initialisation simple !")
    except Exception as e2:
        print(f"‚úó √âchec aussi : {e2}")

INITIALISATION AVEC TON PROJET GEE
Project ID utilis√© : userscheikhthioub501

√âtape 1 : Importation de Google Earth Engine...
√âtape 2 : Initialisation...
‚úì SUCC√àS ! Google Earth Engine est initialis√©
‚úì Projet utilis√© : userscheikhthioub501


In [7]:
# Cellule 4 : CHARGEMENT DE TES DONN√âES GADM
print("CHARGEMENT DE TES DONN√âES GADM DEPUIS TON ASSET")
print("=" * 70)

import ee

# TON Asset ID exact
TON_ASSET_ID = "projects/earthengine-legacy/assets/GADM/gadm41_SEN_2"
print(f"Asset ID utilis√© : {TON_ASSET_ID}")

try:
    # Charger TES donn√©es
    senegal_gadm = ee.FeatureCollection(TON_ASSET_ID)
    
    # Compter les d√©partements
    nb_depts = senegal_gadm.size().getInfo()
    print(f"‚úÖ SUCC√àS ! {nb_depts} d√©partements charg√©s")
    
    # Afficher les propri√©t√©s du premier d√©partement
    premier = senegal_gadm.first()
    props = premier.getInfo()['properties']
    
    print(f"\nPropri√©t√©s disponibles (10 premi√®res) :")
    for i, (cle, valeur) in enumerate(list(props.items())[:10]):
        print(f"  {i+1:2d}. {cle:20} : {str(valeur)[:30]}...")
    
    # Chercher le nom du d√©partement
    noms_possibles = ['NAME_2', 'name_2', 'NOM', 'nom', 'NAME', 'ADM2_NAME', 'adm2_name']
    nom_colonne = None
    
    for nom in noms_possibles:
        if nom in props:
            nom_colonne = nom
            break
    
    if nom_colonne:
        print(f"\n‚úÖ Colonne pour les noms : '{nom_colonne}'")
        
        # Afficher 5 premiers d√©partements
        print("\n5 premiers d√©partements :")
        depts = senegal_gadm.toList(5).getInfo()
        
        for i, dept in enumerate(depts):
            nom = dept['properties'].get(nom_colonne, 'Nom inconnu')
            # Chercher aussi la r√©gion
            region_cols = ['NAME_1', 'name_1', 'ADM1_NAME', 'REGION']
            region = 'R√©gion inconnue'
            for reg in region_cols:
                if reg in dept['properties']:
                    region = dept['properties'][reg]
                    break
            
            print(f"  {i+1}. {nom:25} ‚Üí R√©gion: {region}")
    else:
        print("\n‚ö†Ô∏è Colonne de noms non trouv√©e")
        print(f"  Propri√©t√©s disponibles : {list(props.keys())}")
    
    print(f"\n‚úÖ TES DONN√âES GADM SONT PR√äTES POUR L'ANALYSE !")
    
except Exception as e:
    print(f"‚ùå ERREUR : {e}")
    print("\nProbl√®mes possibles :")
    print("1. Asset ID incorrect")
    print("2. Shapefile pas encore compl√®tement upload√©")
    print("3. Probl√®me de permissions")
    print("\nOn utilise FAO GAUL en attendant...")
    
    senegal_gadm = ee.FeatureCollection("FAO/GAUL/2015/level2") \
        .filter(ee.Filter.eq('ADM0_NAME', 'Senegal'))
    print(f"‚úì {senegal_gadm.size().getInfo()} d√©partements (FAO temporaire)")

CHARGEMENT DE TES DONN√âES GADM DEPUIS TON ASSET
Asset ID utilis√© : projects/earthengine-legacy/assets/GADM/gadm41_SEN_2
‚ùå ERREUR : Collection.loadTable: Name "projects/earthengine-legacy/assets/GADM/gadm41_SEN_2" is invalid.  Legacy assets under "projects/earthengine-legacy/assets/**" must have the top-level folders "users" or "projects" (e.g., "projects/earthengine-legacy/assets/users/foo/bar") and public assets must start with "projects/earthengine-public/

Probl√®mes possibles :
1. Asset ID incorrect
2. Shapefile pas encore compl√®tement upload√©
3. Probl√®me de permissions

On utilise FAO GAUL en attendant...
‚úì 43 d√©partements (FAO temporaire)


In [15]:
"""
SCRIPT UNIFIE - Tous les d√©partements avec masque SCL 4, 6, 7
Masque commun : v√©g√©tation + eau + non classifi√©
Seuil fixe : NDBI > 0
"""

import ee
import pandas as pd
import time
from datetime import datetime

# ============================================
# 1. INITIALISATION
# ============================================

try:
    ee.Initialize()
    print(" Google Earth Engine initialis√©")
except Exception as e:
    print(" Erreur d'initialisation :", e)
    raise

# Configuration
ASSET_GADM = "projects/userscheikhthioub501/assets/gadm41_SEN_2"
ANNEE = 2018

print(f"\n P√©riode d'analyse : {ANNEE}-01-01 √† {ANNEE}-12-31")
print(f" Seuil fixe : NDBI > 0")
print(f" Masque SCL unifi√© : Classes 4, 6, 7")
print("   ‚Ä¢ 4: V√©g√©tation")
print("   ‚Ä¢ 6: Eau")
print("   ‚Ä¢ 7: Non classifi√© (inclut potentiellement zones urbaines)")

# ============================================
# 2. FONCTION DE MASQUAGE UNIFIE
# ============================================

def masquer_uniforme_467(image):
    """
    Masque unifi√© pour TOUS les d√©partements
    Classes SCL : 4 (v√©g√©tation), 6 (eau), 7 (non classifi√©)
    """
    scl = image.select('SCL')
    
    # Masque : seulement 4, 6, 7
    masque_valide = scl.eq(4).Or(scl.eq(6)).Or(scl.eq(7))
    
    # Appliquer le masque
    image_masquee = image.updateMask(masque_valide)
    
    # Normaliser les r√©flectances (toujours diviser par 10000)
    bands = ['B2', 'B3', 'B4', 'B8', 'B11']
    return image_masquee.select(bands).divide(10000)

# ============================================
# 3. CHARGEMENT ET PR√âPARATION
# ============================================

print("\nüîç Chargement des images Sentinel-2...")

# Collection pour toute l'ann√©e
collection_s2 = ee.ImageCollection('COPERNICUS/S2_SR_HARMONIZED') \
    .filterBounds(ee.FeatureCollection(ASSET_GADM)) \
    .filterDate(f'{ANNEE}-01-01', f'{ANNEE}-12-31') \
    .filter(ee.Filter.lt('CLOUDY_PIXEL_PERCENTAGE', 50))

nombre_images_total = collection_s2.size().getInfo()
print(f"   Nombre total d'images : {nombre_images_total}")

# ============================================
# 4. ANALYSE PAR D√âPARTEMENT
# ============================================

print("\nüìä Analyse de tous les d√©partements avec masque 4,6,7...")

senegal = ee.FeatureCollection(ASSET_GADM)
features = senegal.toList(senegal.size()).getInfo()



print(f"   Nombre total de d√©partements : {len(features)}")

resultats = []

for i, feat in enumerate(features):
    try:
        feature = ee.Feature(feat)
        geom = feature.geometry()
        props = feat['properties']
        
        nom_dept = props.get('NAME_2', f'Dept_{i}')
        nom_region = props.get('NAME_1', '')
        
        print(f"   [{i+1}/{len(features)}] {nom_dept} ({nom_region})...")
        
        # ====================================
        # √âTAPE 1 : Cr√©ation du composite d√©partemental
        # ====================================
        
        collection_dept = collection_s2 \
            .filterBounds(geom) \
            .map(masquer_uniforme_467)
        
        n_images = collection_dept.size().getInfo()
        
        
        
        if n_images > 0:
            # ====================================
            # √âTAPE 2 : Cr√©ation du composite (MOYENNE)
            # ====================================
            composite = collection_dept.mean().clip(geom)
            
            # ====================================
            # √âTAPE 3 : Calcul du NDBI
            # ====================================
            ndbi = composite.normalizedDifference(['B11', 'B8']).rename('NDBI')
            
            # Calcul du NDBI moyen (pour information)
            stats_ndbi = ndbi.reduceRegion(
                reducer=ee.Reducer.mean(),
                geometry=geom,
                scale=30,
                maxPixels=1e9,
                bestEffort=True
            ).getInfo()
            
            ndbi_moyen = stats_ndbi.get('NDBI', 0) or 0
            
            # ====================================
            # √âTAPE 4 : Classification avec seuil NDBI > 0
            # ====================================
            seuil = 0
            zones_baties = ndbi.gt(seuil).rename('bati')
            
            # Calcul du pourcentage de zones b√¢ties
            stats_bati = zones_baties.reduceRegion(
                reducer=ee.Reducer.mean(),
                geometry=geom,
                scale=30,
                maxPixels=1e9,
                bestEffort=True
            ).getInfo()
            
            pct_bati = (stats_bati.get('bati', 0) or 0) * 100
            
            # ====================================
            # √âTAPE 5 : Diagnostic et validation
            # ====================================
            
            # Diagnostic bas√© sur le type de d√©partement
            diagnostic = "OK"
            
            # D√©partements urbains majeurs
            depts_urbains_majeurs = ['Dakar', 'Pikine', 'Gu√©diawaye', 'Rufisque', 'Thi√®s', 'Saint-Louis']
            if nom_dept in depts_urbains_majeurs:
                if pct_bati < 5:
                    diagnostic = "URBAIN_TROP_FAIBLE"
                elif pct_bati > 90:
                    diagnostic = "URBAIN_TROP_ELEVE"
            
            # D√©partements urbains secondaires
            depts_urbains_secondaires = ['Mbour', 'Mback√©', 'Diourbel', 'Kaolack', 'Ziguinchor']
            if nom_dept in depts_urbains_secondaires:
                if pct_bati < 2:
                    diagnostic = "URBAIN_SECONDAIRE_FAIBLE"
                elif pct_bati > 80:
                    diagnostic = "URBAIN_SECONDAIRE_ELEVE"
            
            # Diagnostic g√©n√©ral
            if pct_bati < 0.1:
                diagnostic = "TRES_FAIBLE"
            elif pct_bati > 95:
                diagnostic = "TRES_ELEVE"
            
            print(f"     ‚Üí {pct_bati:.1f}% de zones b√¢ties")
            print(f"       NDBI moyen: {ndbi_moyen:.3f}, Images: {n_images}")
            
            if diagnostic != "OK":
                print(f"        Diagnostic: {diagnostic}")
            
        else:
            pct_bati = -1
            ndbi_moyen = -999
            diagnostic = "PAS_D_IMAGES"
            print(f"      Aucune image disponible m√™me apr√®s relaxation")
        
        # ====================================
        # √âTAPE 6 : Enregistrement des r√©sultats
        # ====================================
        
        resultat = {
            'CODE_REGION': props.get('GID_1', ''),
            'NOM_REGION': nom_region,
            'CODE_DEPT': props.get('GID_2', ''),
            'NOM_DEPT': nom_dept,
            'PCT_BATI': pct_bati,
            'NDBI_MOYEN': ndbi_moyen,
            'SEUIL_NDBI': 0,
            'IMAGES_DISPONIBLES': n_images,
            'DIAGNOSTIC': diagnostic,
            'STRATEGIE': 'UNIFORME_4_6_7',
            'PERIODE': f'{ANNEE}-01-01_{ANNEE}-12-31',
            'MASQUE_SCL': '4,6,7',
            'METHODE_COMPOSITE': 'MOYENNE',
            'DATE_TRAITEMENT': datetime.now().strftime('%Y-%m-%d %H:%M:%S')
        }
        
        resultats.append(resultat)
        
        # Petite pause pour √©viter les limites
        time.sleep(0.05)
        
    except Exception as e:
        nom_dept = props.get('NAME_2', f'Dept_{i}') if 'props' in locals() else f'Dept_{i}'
        error_msg = str(e)[:100]
        print(f" Erreur sur {nom_dept}: {error_msg}")
        
        resultats.append({
            'CODE_REGION': props.get('GID_1', '') if 'props' in locals() else '',
            'NOM_REGION': props.get('NAME_1', '') if 'props' in locals() else '',
            'CODE_DEPT': props.get('GID_2', '') if 'props' in locals() else '',
            'NOM_DEPT': nom_dept,
            'PCT_BATI': -1,
            'NDBI_MOYEN': -999,
            'SEUIL_NDBI': 0,
            'IMAGES_DISPONIBLES': 0,
            'DIAGNOSTIC': 'ERREUR',
            'STRATEGIE': 'UNIFORME_4_6_7',
            'PERIODE': f'{ANNEE}-01-01_{ANNEE}-12-31',
            'MASQUE_SCL': '4,6,7',
            'METHODE_COMPOSITE': 'MOYENNE',
            'DATE_TRAITEMENT': datetime.now().strftime('%Y-%m-%d %H:%M:%S')
        })
        continue

# ============================================
# 5. ANALYSE DES R√âSULTATS
# ============================================


print(" ANALYSE DES R√âSULTATS FINAUX")

df = pd.DataFrame(resultats)


if len(df) > 0:
    print(f"\nüìä DISTRIBUTION DES R√âSULTATS :")
    print(f"   % B√¢ti moyen : {df['PCT_BATI'].mean():.1f}%")
    print(f"   M√©diane : {df['PCT_BATI'].median():.1f}%")
    print(f"   Minimum : {df['PCT_BATI'].min():.1f}%")
    print(f"   Maximum : {df['PCT_BATI'].max():.1f}%")
    print(f"   √âcart-type : {df['PCT_BATI'].std():.1f}%")
    
   
  
    
    # Top 20 urbanis√©s
    print(f"\n TOP 20 D√âPARTEMENTS LES PLUS URBANIS√âS :")
    top_20 = df.sort_values('PCT_BATI', ascending=False).head(20)
    for i, (_, row) in enumerate(top_20.iterrows(), 1):
        diag_indicator = "" if row['DIAGNOSTIC'] == 'OK' else f" ‚ö†Ô∏è{row['DIAGNOSTIC']}"
        print(f"   {i:2}. {row['NOM_DEPT']:20} : {row['PCT_BATI']:6.1f}%{diag_indicator}")
    
    # Analyse par r√©gion
    print(f"\n ANALYSE PAR R√âGION :")
    regions_stats = df.groupby('NOM_REGION').agg({
        'PCT_BATI': ['mean', 'count', 'min', 'max'],
        'NOM_DEPT': 'first'
    }).round(1)
    
    regions_stats.columns = ['MOYENNE', 'NB_DEPTS', 'MIN', 'MAX', 'REGION']
    
    # Trier par % b√¢ti moyen d√©croissant
    regions_stats = regions_stats.sort_values('MOYENNE', ascending=False)
    
    for region, data in regions_stats.iterrows():
        print(f"   {region:15} : {data['MOYENNE']:5.1f}% (min:{data['MIN']:4.1f}%, max:{data['MAX']:5.1f}%, {int(data['NB_DEPTS'])} depts)")

# ============================================
# 6. SAUVEGARDE ET EXPORT
# ============================================

print(f"\n Sauvegarde des r√©sultats...")

# Nom du fichier avec timestamp
timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
fichier_resultats = f"senegal_unifie_467_{timestamp}.csv"
df.to_csv(fichier_resultats, index=False, encoding='utf-8-sig')


print(f" Fichier complet sauvegard√© : {fichier_resultats}")






 Google Earth Engine initialis√©

 P√©riode d'analyse : 2018-01-01 √† 2018-12-31
 Seuil fixe : NDBI > 0
 Masque SCL unifi√© : Classes 4, 6, 7
   ‚Ä¢ 4: V√©g√©tation
   ‚Ä¢ 6: Eau
   ‚Ä¢ 7: Non classifi√© (inclut potentiellement zones urbaines)

üîç Chargement des images Sentinel-2...
   Nombre total d'images : 375

üìä Analyse de tous les d√©partements avec masque 4,6,7...
   Nombre total de d√©partements : 45
   [1/45] Dagana (Saint-Louis)...
     ‚Üí 33.4% de zones b√¢ties
       NDBI moyen: -0.110, Images: 27
   [2/45] Podor (Saint-Louis)...
     ‚Üí 35.1% de zones b√¢ties
       NDBI moyen: -0.086, Images: 52
   [3/45] Saint-Louis (Saint-Louis)...
     ‚Üí 76.6% de zones b√¢ties
       NDBI moyen: 0.073, Images: 1
   [4/45] Bounkiling (S√©dhiou)...
     ‚Üí 46.9% de zones b√¢ties
       NDBI moyen: -0.012, Images: 17
   [5/45] Goudomp (S√©dhiou)...
     ‚Üí 16.1% de zones b√¢ties
       NDBI moyen: -0.091, Images: 29
   [6/45] S√©dhiou (S√©dhiou)...
     ‚Üí 19.6% de zones b√¢tie

In [26]:
"""
SCRIPT COMPLET - Visualisation Urbanisation S√©n√©gal avec Cartes GADM
Auteur: Analyse Spatiale TP6
Date: D√©cembre 2024
"""

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
from pathlib import Path
import geopandas as gpd
import unicodedata
import warnings
warnings.filterwarnings('ignore')

# Configuration
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (14, 8)

# ============================================
# CHEMINS ET CONFIGURATION
# ============================================

REPERTOIRE_BASE = Path(r"C:\Users\HP\Documents\ISEP3\Semestre 1_CT\Stat\Stat_Spatiale\TP6")
CHEMIN_CSV = REPERTOIRE_BASE / "data" / "senegal_unifie_467_20251222_141659.csv"
# CORRECTION 1: Supprimer l'espace apr√®s "gadm" -> "gadm" pas "gadm "
CHEMIN_GADM = REPERTOIRE_BASE / "data" / "GADM" / "gadm" / "gadm41_SEN_shp"
DOSSIER_SORTIE = REPERTOIRE_BASE / "visualisations"

SHP_REGIONS = CHEMIN_GADM / "gadm41_SEN_1.shp"
SHP_DEPARTEMENTS = CHEMIN_GADM / "gadm41_SEN_2.shp"

# ============================================
# FONCTIONS UTILITAIRES
# ============================================

def normaliser_noms(nom):
    """Normalise les noms pour le matching"""
    nom = str(nom).upper().strip()
    nom = ''.join(c for c in unicodedata.normalize('NFD', nom) 
                  if unicodedata.category(c) != 'Mn')
    nom = ''.join(c if c.isalnum() or c.isspace() else ' ' for c in nom)
    return ' '.join(nom.split())

def charger_donnees():
    """Charge toutes les donn√©es n√©cessaires"""
    print("="*70)
    print("CHARGEMENT DES DONN√âES")
    print("="*70)
    
    # CORRECTION 2: Ajouter un test pour v√©rifier que les fichiers existent
    print(f"üìÇ V√©rification des fichiers...")
    print(f"  - CSV: {CHEMIN_CSV}")
    print(f"    Existe: {'‚úì' if CHEMIN_CSV.exists() else '‚úó'}")
    print(f"  - Shapefile r√©gions: {SHP_REGIONS}")
    print(f"    Existe: {'‚úì' if SHP_REGIONS.exists() else '‚úó'}")
    print(f"  - Shapefile d√©partements: {SHP_DEPARTEMENTS}")
    print(f"    Existe: {'‚úì' if SHP_DEPARTEMENTS.exists() else '‚úó'}")
    
    if not SHP_REGIONS.exists() or not SHP_DEPARTEMENTS.exists():
        print("\n‚ùå ERREUR: Fichiers shapefile non trouv√©s!")
        print(f"   V√©rifiez que ces fichiers existent:")
        print(f"   {SHP_REGIONS}")
        print(f"   {SHP_DEPARTEMENTS}")
        print("\n   Essayez cette correction alternative:")
        print(f"   CHEMIN_GADM = REPERTOIRE_BASE / 'data' / 'GADM' / 'gadm41_SEN_shp'")
        return None, None, None, None
    
    # CSV
    print(f"\nüìä Chargement CSV...")
    df = pd.read_csv(CHEMIN_CSV, encoding='utf-8-sig')
    df = df[df['PCT_BATI'] >= 0].copy()
    print(f"‚úì {len(df)} d√©partements, {len(df)} valides")
    
    # Shapefiles
    print(f"\nüó∫Ô∏è  Chargement shapefiles GADM...")
    gdf_dept = gpd.read_file(SHP_DEPARTEMENTS)
    gdf_region = gpd.read_file(SHP_REGIONS)
    print(f"‚úì {len(gdf_dept)} d√©partements, {len(gdf_region)} r√©gions")
    
    DOSSIER_SORTIE.mkdir(exist_ok=True)
    print(f"‚úì Dossier sortie: {DOSSIER_SORTIE}")
    
    return df, df, gdf_dept, gdf_region

# ============================================
# GRAPHIQUES STATISTIQUES
# ============================================

def stats_descriptives(df):
    """Affiche statistiques"""
    print("\n" + "="*70)
    print("üìä STATISTIQUES DESCRIPTIVES")
    print("="*70)
    stats = df['PCT_BATI'].describe()
    print(f"\nMoyenne: {stats['mean']:.2f}% | M√©diane: {stats['50%']:.2f}%")
    print(f"Min: {stats['min']:.2f}% | Max: {stats['max']:.2f}%")
    print(f"√âcart-type: {stats['std']:.2f}%")

def graphique_distribution(df):
    """Distribution de l'urbanisation"""
    fig, axes = plt.subplots(2, 2, figsize=(16, 12))
    fig.suptitle('Distribution Urbanisation - S√©n√©gal 2018', fontsize=16, fontweight='bold')
    
    # Histogramme
    axes[0,0].hist(df['PCT_BATI'], bins=30, color='steelblue', edgecolor='black')
    axes[0,0].axvline(df['PCT_BATI'].mean(), color='red', linestyle='--', 
                      label=f"Moy: {df['PCT_BATI'].mean():.1f}%")
    axes[0,0].set_title('Distribution des taux')
    axes[0,0].legend()
    axes[0,0].grid(alpha=0.3)
    
    # Boxplot
    axes[0,1].boxplot(df['PCT_BATI'], patch_artist=True)
    axes[0,1].set_title('Boxplot')
    axes[0,1].grid(alpha=0.3)
    
    # Cumulative
    sorted_data = np.sort(df['PCT_BATI'])
    cumulative = np.arange(1, len(sorted_data)+1) / len(sorted_data) * 100
    axes[1,0].plot(sorted_data, cumulative, 'b-', linewidth=2)
    axes[1,0].set_title('Distribution cumulative')
    axes[1,0].grid(alpha=0.3)
    
    # Cat√©gories
    bins = [0, 1, 5, 10, 20, 100]
    labels = ['<1%', '1-5%', '5-10%', '10-20%', '>20%']
    cats = pd.cut(df['PCT_BATI'], bins=bins, labels=labels)
    counts = cats.value_counts().sort_index()
    colors = ['#2ecc71', '#f39c12', '#e67e22', '#e74c3c', '#c0392b']
    axes[1,1].bar(range(len(counts)), counts.values, color=colors, edgecolor='black')
    axes[1,1].set_xticks(range(len(counts)))
    axes[1,1].set_xticklabels(labels)
    axes[1,1].set_title('Cat√©gories d\'urbanisation')
    
    plt.tight_layout()
    plt.savefig(DOSSIER_SORTIE / '01_distribution.png', dpi=300, bbox_inches='tight')
    print(f"‚úì 01_distribution.png")
    plt.close()

def graphique_top_departements(df):
    """Top et Bottom d√©partements"""
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(18, 10))
    fig.suptitle('Classement des D√©partements', fontsize=16, fontweight='bold')
    
    # Top 20
    top20 = df.nlargest(20, 'PCT_BATI')
    y = np.arange(len(top20))
    ax1.barh(y, top20['PCT_BATI'], color='steelblue', edgecolor='black')
    ax1.set_yticks(y)
    ax1.set_yticklabels([f"{r['NOM_DEPT']}" for _, r in top20.iterrows()], fontsize=9)
    ax1.set_title('Top 20 - Plus urbanis√©s', fontweight='bold')
    ax1.invert_yaxis()
    ax1.grid(alpha=0.3, axis='x')
    
    # Bottom 20
    bottom20 = df.nsmallest(20, 'PCT_BATI')
    y2 = np.arange(len(bottom20))
    ax2.barh(y2, bottom20['PCT_BATI'], color='coral', edgecolor='black')
    ax2.set_yticks(y2)
    ax2.set_yticklabels([f"{r['NOM_DEPT']}" for _, r in bottom20.iterrows()], fontsize=9)
    ax2.set_title('Bottom 20 - Moins urbanis√©s', fontweight='bold')
    ax2.invert_yaxis()
    ax2.grid(alpha=0.3, axis='x')
    
    plt.tight_layout()
    plt.savefig(DOSSIER_SORTIE / '02_top_departements.png', dpi=300, bbox_inches='tight')
    print(f"‚úì 02_top_departements.png")
    plt.close()

def graphique_regions(df_valides):
    """Analyse par r√©gion"""
    stats_reg = df_valides.groupby('NOM_REGION')['PCT_BATI'].agg(['mean', 'count']).sort_values('mean', ascending=False)
    
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(18, 10))  # Augment√© la largeur
    fig.suptitle('Analyse par R√©gion - S√©n√©gal 2018', fontsize=16, fontweight='bold')
    
    # Moyennes avec noms et valeurs
    y = np.arange(len(stats_reg))
    bars = ax1.barh(y, stats_reg['mean'], color='steelblue', edgecolor='black')
    ax1.set_yticks(y)
    
    # Noms des r√©gions avec statistiques
    labels = []
    for idx, (region, row) in enumerate(stats_reg.iterrows()):
        label = f"{region}\n({row['count']} depts, {row['mean']:.1f}%)"
        labels.append(label)
    
    ax1.set_yticklabels(labels, fontsize=9)
    ax1.set_title('Taux moyen d\'urbanisation par r√©gion', fontweight='bold')
    ax1.invert_yaxis()
    ax1.grid(alpha=0.3, axis='x')
    ax1.set_xlabel('Taux d\'urbanisation (%)')
    
    # Ajouter les valeurs sur les barres
    for i, bar in enumerate(bars):
        width = bar.get_width()
        ax1.text(width + 0.2, bar.get_y() + bar.get_height()/2, 
                f'{width:.1f}%', ha='left', va='center', fontsize=9)
    
    # Boxplots am√©lior√©s
    regions_order = stats_reg.index
    data = [df_valides[df_valides['NOM_REGION']==r]['PCT_BATI'].values for r in regions_order]
    bp = ax2.boxplot(data, labels=regions_order, patch_artist=True, showmeans=True)
    
    for patch in bp['boxes']:
        patch.set_facecolor('lightblue')
    
    # Moyennes en rouge
    bp['means'][0].set_marker('D')
    bp['means'][0].set_markerfacecolor('red')
    bp['means'][0].set_markeredgecolor('red')
    
    ax2.set_xticklabels(regions_order, rotation=45, ha='right', fontsize=8)
    ax2.set_title('Distribution des taux par r√©gion', fontweight='bold')
    ax2.grid(alpha=0.3, axis='y')
    ax2.set_ylabel('Taux d\'urbanisation (%)')
    
    # Ajouter l'√©chelle et infos
    ax2.text(0.02, 0.98, f'Total: {len(df_valides)} d√©partements',
            transform=ax2.transAxes, fontsize=9,
            verticalalignment='top',
            bbox=dict(boxstyle='round', facecolor='wheat', alpha=0.5))
    
    plt.tight_layout()
    plt.savefig(DOSSIER_SORTIE / '03_analyse_regions.png', dpi=300, bbox_inches='tight')
    print(f"‚úì 03_analyse_regions.png")
    plt.close()
    
    return stats_reg

# ============================================
# CARTES CHOROPL√àTHES
# ============================================
# ============================================
# CARTES CHOROPL√àTHES AM√âLIOR√âES (sans mapclassify)
# ============================================

def carte_departements(df_valides, gdf_dept):
    """Carte d√©partements avec noms et √©chelle"""
    # Normalisation et fusion
    df_valides['NOM_NORM'] = df_valides['NOM_DEPT'].apply(normaliser_noms)
    gdf_dept['NOM_NORM'] = gdf_dept['NAME_2'].apply(normaliser_noms)
    gdf = gdf_dept.merge(df_valides[['NOM_NORM', 'PCT_BATI', 'NDBI_MOYEN', 'NOM_REGION']], 
                         on='NOM_NORM', how='left')
    
    matched = gdf['PCT_BATI'].notna().sum()
    print(f"\nüìç D√©partements match√©s: {matched}/{len(gdf)} ({matched/len(gdf)*100:.1f}%)")
    
    # Carte
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(22, 12))
    fig.suptitle('ANALYSE SPATIALE DE L\'URBANISATION - S√âN√âGAL 2018\nCartographie par D√©partement',
                 fontsize=18, fontweight='bold', y=0.98)
    
    # 1. TAUX D'URBANISATION
    # Classification manuelle (quantiles) au lieu de NaturalBreaks
    if gdf['PCT_BATI'].notna().sum() > 5:
        # Cr√©er 5 classes bas√©es sur les quantiles
        pct_data = gdf['PCT_BATI'].dropna()
        if len(pct_data) >= 5:
            quantiles = np.percentile(pct_data, [0, 20, 40, 60, 80, 100])
            # Ajuster les limites pour √©viter les valeurs d√©cimales trop pr√©cises
            quantiles = [round(q, 1) for q in quantiles]
            labels = [f'{quantiles[i]:.1f}-{quantiles[i+1]:.1f}%' for i in range(len(quantiles)-1)]
    
    # Carte choropl√®the avec classification
    gdf.plot(column='PCT_BATI', cmap='YlOrRd', linewidth=0.8, edgecolor='black', 
             legend=True, ax=ax1, missing_kwds={'color': 'lightgrey', 'label': 'Donn√©es manquantes'},
             legend_kwds={'label': 'Taux d\'Urbanisation (%)', 'shrink': 0.7, 
                         'orientation': 'horizontal', 'pad': 0.02})
    
    # Ajouter noms des d√©partements principaux (top 15 pour √©viter surcharge)
    top_depts = df_valides.nlargest(15, 'PCT_BATI')
    for _, dept in top_depts.iterrows():
        dept_norm = normaliser_noms(dept['NOM_DEPT'])
        dept_geom = gdf[gdf['NOM_NORM'] == dept_norm]
        if not dept_geom.empty and not dept_geom.geometry.is_empty.all():
            centroid = dept_geom.geometry.centroid.iloc[0]
            # Nom abr√©g√© si trop long
            nom = dept['NOM_DEPT']
            if len(nom) > 15:
                nom = nom[:12] + '...'
            ax1.annotate(f"{nom}\n{dept['PCT_BATI']:.1f}%",
                        xy=(centroid.x, centroid.y), xytext=(3, 3),
                        textcoords="offset points", fontsize=7, fontweight='bold',
                        bbox=dict(boxstyle='round,pad=0.3', facecolor='white', alpha=0.8))
    
    ax1.set_title('TAUX D\'URBANISATION PAR D√âPARTEMENT', fontsize=14, fontweight='bold', pad=15)
    ax1.axis('off')
    
    # √âchelle manuelle (sans matplotlib-scalebar)
    bounds = gdf.total_bounds
    # Calculer la distance en degr√©s pour 100 km (1 degr√© ‚âà 111 km)
    scale_deg = 100 / 111  # Environ 0.9 degr√©s pour 100 km
    
    # Dessiner une barre d'√©chelle manuellement
    scale_x = bounds[0] + (bounds[2] - bounds[0]) * 0.05  # 5% depuis la gauche
    scale_y = bounds[1] + (bounds[3] - bounds[1]) * 0.05  # 5% depuis le bas
    
    ax1.plot([scale_x, scale_x + scale_deg], [scale_y, scale_y], 
             color='black', linewidth=3)
    ax1.plot([scale_x, scale_x], [scale_y-0.05, scale_y+0.05], 
             color='black', linewidth=2)
    ax1.plot([scale_x + scale_deg, scale_x + scale_deg], [scale_y-0.05, scale_y+0.05], 
             color='black', linewidth=2)
    ax1.text(scale_x + scale_deg/2, scale_y - 0.1, '100 km', 
             ha='center', va='top', fontsize=9, fontweight='bold',
             bbox=dict(boxstyle='round', facecolor='white', alpha=0.8))
    
    # Ajouter fl√®che nord
    north_x = bounds[0] + (bounds[2] - bounds[0]) * 0.95
    north_y = bounds[1] + (bounds[3] - bounds[1]) * 0.95
    ax1.text(north_x, north_y, 'N', fontsize=14, fontweight='bold',
             va='center', ha='center', 
             bbox=dict(boxstyle='circle', facecolor='white', edgecolor='black'))
    
    # 2. NDBI MOYEN
    gdf.plot(column='NDBI_MOYEN', cmap='RdYlGn_r', linewidth=0.8, edgecolor='black',
             legend=True, ax=ax2, missing_kwds={'color': 'lightgrey', 'label': 'Donn√©es manquantes'},
             legend_kwds={'label': 'NDBI Moyen (Built-up Index)', 'shrink': 0.7,
                         'orientation': 'horizontal', 'pad': 0.02})
    
    # Ajouter noms des r√©gions (centro√Ødes r√©gionaux)
    # Dissoudre par r√©gion pour obtenir les polygones r√©gionaux
    try:
        gdf_regions = gdf.dissolve(by='NOM_REGION')
        for idx, region in gdf_regions.iterrows():
            if region.geometry.centroid.is_empty:
                continue
            centroid = region.geometry.centroid
            ax2.annotate(idx.upper(), xy=(centroid.x, centroid.y), fontsize=10,
                        fontweight='bold', ha='center', va='center',
                        bbox=dict(boxstyle='round,pad=0.5', facecolor='yellow', alpha=0.7))
    except:
        # Fallback: utiliser les noms des d√©partements de chaque r√©gion
        regions = gdf['NOM_REGION'].dropna().unique()
        for region in regions:
            region_depts = gdf[gdf['NOM_REGION'] == region]
            if len(region_depts) > 0:
                centroid = region_depts.geometry.centroid.mean()
                ax2.annotate(region.upper(), xy=(centroid.x, centroid.y), fontsize=9,
                            fontweight='bold', ha='center', va='center',
                            bbox=dict(boxstyle='round,pad=0.4', facecolor='yellow', alpha=0.7))
    
    ax2.set_title('NDBI MOYEN PAR D√âPARTEMENT\n(Indice de Surface B√¢tie Normalis√©)', 
                 fontsize=14, fontweight='bold', pad=15)
    ax2.axis('off')
    
    # √âchelle manuelle pour ax2
    ax2.plot([scale_x, scale_x + scale_deg], [scale_y, scale_y], 
             color='black', linewidth=3)
    ax2.plot([scale_x, scale_x], [scale_y-0.05, scale_y+0.05], 
             color='black', linewidth=2)
    ax2.plot([scale_x + scale_deg, scale_x + scale_deg], [scale_y-0.05, scale_y+0.05], 
             color='black', linewidth=2)
    ax2.text(scale_x + scale_deg/2, scale_y - 0.1, '100 km', 
             ha='center', va='top', fontsize=9, fontweight='bold',
             bbox=dict(boxstyle='round', facecolor='white', alpha=0.8))
    
    # L√©gende d'√©chelle commune
    fig.text(0.5, 0.02, 
             f'Source: Donn√©es GADM & Analyse Spatiale 2018 | D√©partements avec donn√©es: {matched}/{len(gdf)} | Projection: WGS84',
             ha='center', fontsize=9, style='italic')
    
    # Statistiques dans un encadr√©
    stats_text = f"""
    STATISTIQUES GLOBALES:
    ‚Ä¢ Taux moyen: {df_valides['PCT_BATI'].mean():.1f}%
    ‚Ä¢ M√©diane: {df_valides['PCT_BATI'].median():.1f}%
    ‚Ä¢ √âcart-type: {df_valides['PCT_BATI'].std():.1f}%
    ‚Ä¢ Min: {df_valides['PCT_BATI'].min():.1f}%
    ‚Ä¢ Max: {df_valides['PCT_BATI'].max():.1f}%
    ‚Ä¢ NDBI moyen: {df_valides['NDBI_MOYEN'].mean():.3f}
    ‚Ä¢ D√©partements: {len(df_valides)}
    """
    fig.text(0.02, 0.02, stats_text, fontsize=8,
             bbox=dict(boxstyle='round', facecolor='lightblue', alpha=0.8),
             verticalalignment='bottom')
    
    plt.tight_layout(rect=[0, 0.05, 1, 0.95])
    plt.savefig(DOSSIER_SORTIE / '04_carte_departements.png', dpi=300, bbox_inches='tight')
    print(f"‚úì 04_carte_departements.png")
    plt.close()


def carte_regions(df_valides, gdf_region):
    """Carte r√©gions avec noms et √©chelle"""
    # Moyennes par r√©gion
    reg_moyennes = df_valides.groupby('NOM_REGION').agg({
        'PCT_BATI': ['mean', 'std', 'count'],
        'NDBI_MOYEN': 'mean'
    }).round(2)
    
    # Aplatir les colonnes
    reg_moyennes.columns = ['PCT_MEAN', 'PCT_STD', 'DEPT_COUNT', 'NDBI_MEAN']
    reg_moyennes = reg_moyennes.reset_index()
    reg_moyennes['NOM_NORM'] = reg_moyennes['NOM_REGION'].apply(normaliser_noms)
    
    # Fusion
    gdf_region['NOM_NORM'] = gdf_region['NAME_1'].apply(normaliser_noms)
    gdf = gdf_region.merge(reg_moyennes, on='NOM_NORM', how='left')
    
    matched = gdf['PCT_MEAN'].notna().sum()
    print(f"üìç R√©gions match√©es: {matched}/{len(gdf)} ({matched/len(gdf)*100:.1f}%)")
    
    # Carte
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(22, 12))
    fig.suptitle('ANALYSE R√âGIONALE DE L\'URBANISATION - S√âN√âGAL 2018\nCartographie par R√©gion Administrative',
                 fontsize=18, fontweight='bold', y=0.98)
    
    # 1. TAUX MOYEN PAR R√âGION
    gdf.plot(column='PCT_MEAN', cmap='OrRd', linewidth=1.5, edgecolor='black',
             legend=True, ax=ax1, missing_kwds={'color': 'lightgrey', 'label': 'Donn√©es manquantes'},
             legend_kwds={'label': 'Taux d\'Urbanisation Moyen (%)', 'shrink': 0.7,
                         'orientation': 'horizontal', 'pad': 0.02})
    
    # Ajouter noms des r√©gions avec valeurs
    for idx, row in gdf.iterrows():
        if pd.notna(row['PCT_MEAN']):
            centroid = row.geometry.centroid
            # Nom de la r√©gion en grand
            ax1.annotate(f"{row['NOM_REGION'].upper()}", 
                        xy=(centroid.x, centroid.y), xytext=(0, 12),
                        textcoords="offset points", fontsize=11, fontweight='bold',
                        ha='center', color='darkblue')
            # Valeur en dessous
            ax1.annotate(f"{row['PCT_MEAN']:.1f}% ¬± {row['PCT_STD']:.1f}%\n({row['DEPT_COUNT']} depts)",
                        xy=(centroid.x, centroid.y), xytext=(0, -12),
                        textcoords="offset points", fontsize=9,
                        ha='center', va='top',
                        bbox=dict(boxstyle='round,pad=0.4', facecolor='white', alpha=0.9))
    
    ax1.set_title('TAUX MOYEN D\'URBANISATION PAR R√âGION', fontsize=14, fontweight='bold', pad=15)
    ax1.axis('off')
    
    # √âchelle manuelle
    bounds = gdf.total_bounds
    scale_x = bounds[0] + (bounds[2] - bounds[0]) * 0.05
    scale_y = bounds[1] + (bounds[3] - bounds[1]) * 0.05
    scale_deg = 100 / 111  # 100 km en degr√©s
    
    ax1.plot([scale_x, scale_x + scale_deg], [scale_y, scale_y], 
             color='black', linewidth=3)
    ax1.plot([scale_x, scale_x], [scale_y-0.05, scale_y+0.05], 
             color='black', linewidth=2)
    ax1.plot([scale_x + scale_deg, scale_x + scale_deg], [scale_y-0.05, scale_y+0.05], 
             color='black', linewidth=2)
    ax1.text(scale_x + scale_deg/2, scale_y - 0.1, '100 km', 
             ha='center', va='top', fontsize=9, fontweight='bold',
             bbox=dict(boxstyle='round', facecolor='white', alpha=0.8))
    
    # 2. NDBI MOYEN PAR R√âGION
    gdf.plot(column='NDBI_MEAN', cmap='RdYlGn', linewidth=1.5, edgecolor='black',
             legend=True, ax=ax2, missing_kwds={'color': 'lightgrey', 'label': 'Donn√©es manquantes'},
             legend_kwds={'label': 'NDBI Moyen par R√©gion', 'shrink': 0.7,
                         'orientation': 'horizontal', 'pad': 0.02})
    
    # Ajouter valeurs NDBI
    for idx, row in gdf.iterrows():
        if pd.notna(row['NDBI_MEAN']):
            centroid = row.geometry.centroid
            ax2.annotate(f"NDBI: {row['NDBI_MEAN']:.3f}", 
                        xy=(centroid.x, centroid.y), fontsize=9, fontweight='bold',
                        ha='center', va='center',
                        bbox=dict(boxstyle='round,pad=0.4', facecolor='white', alpha=0.9))
    
    ax2.set_title('NDBI MOYEN PAR R√âGION\n(Indicateur de Surface B√¢tie)', 
                 fontsize=14, fontweight='bold', pad=15)
    ax2.axis('off')
    
    # √âchelle pour ax2
    ax2.plot([scale_x, scale_x + scale_deg], [scale_y, scale_y], 
             color='black', linewidth=3)
    ax2.plot([scale_x, scale_x], [scale_y-0.05, scale_y+0.05], 
             color='black', linewidth=2)
    ax2.plot([scale_x + scale_deg, scale_x + scale_deg], [scale_y-0.05, scale_y+0.05], 
             color='black', linewidth=2)
    ax2.text(scale_x + scale_deg/2, scale_y - 0.1, '100 km', 
             ha='center', va='top', fontsize=9, fontweight='bold',
             bbox=dict(boxstyle='round', facecolor='white', alpha=0.8))
    
    # Classement des r√©gions
    reg_sorted = reg_moyennes.sort_values('PCT_MEAN', ascending=False)
    classement_text = "CLASSEMENT R√âGIONAL:\n"
    for i, (_, row) in enumerate(reg_sorted.iterrows(), 1):
        classement_text += f"{i}. {row['NOM_REGION']}: {row['PCT_MEAN']:.1f}%\n"
    
    fig.text(0.02, 0.25, classement_text, fontsize=9,
             bbox=dict(boxstyle='round', facecolor='lightgreen', alpha=0.8),
             verticalalignment='top')
    
    # Statistiques r√©gionales
    stats_text = f"""
    STATISTIQUES R√âGIONALES:
    ‚Ä¢ R√©gions: {len(reg_moyennes)}
    ‚Ä¢ D√©partements totaux: {reg_moyennes['DEPT_COUNT'].sum()}
    ‚Ä¢ Taux max: {reg_moyennes['PCT_MEAN'].max():.1f}%
    ‚Ä¢ Taux min: {reg_moyennes['PCT_MEAN'].min():.1f}%
    ‚Ä¢ √âcart moyen: {reg_moyennes['PCT_STD'].mean():.1f}%
    """
    fig.text(0.02, 0.02, stats_text, fontsize=8,
             bbox=dict(boxstyle='round', facecolor='lightblue', alpha=0.8))
    
    # L√©gende
    fig.text(0.5, 0.02,
             f'Source: Analyse Spatiale 2018 | {len(reg_moyennes)} r√©gions analys√©es | Projection: WGS84',
             ha='center', fontsize=9, style='italic')
    
    plt.tight_layout(rect=[0, 0.05, 1, 0.95])
    plt.savefig(DOSSIER_SORTIE / '05_carte_regions.png', dpi=300, bbox_inches='tight')
    print(f"‚úì 05_carte_regions.png")
    plt.close()


def carte_categories(df_valides, gdf_dept):
    """Carte cat√©gories d'urbanisation avec √©chelle"""
    # Cat√©gories
    df_valides['NOM_NORM'] = df_valides['NOM_DEPT'].apply(normaliser_noms)
    bins = [0, 1, 5, 10, 20, 100]
    labels = ['Tr√®s faible (<1%)', 'Faible (1-5%)', 'Mod√©r√©e (5-10%)', 
              '√âlev√©e (10-20%)', 'Tr√®s √©lev√©e (>20%)']
    df_valides['CATEGORIE'] = pd.cut(df_valides['PCT_BATI'], bins=bins, labels=labels)
    
    # Fusion
    gdf_dept['NOM_NORM'] = gdf_dept['NAME_2'].apply(normaliser_noms)
    gdf = gdf_dept.merge(df_valides[['NOM_NORM', 'CATEGORIE', 'NOM_REGION', 'PCT_BATI']], 
                         on='NOM_NORM', how='left')
    
    # Carte
    fig, ax = plt.subplots(figsize=(16, 14))
    fig.suptitle('CLASSIFICATION DE L\'URBANISATION - S√âN√âGAL 2018\nCat√©gories de Taux d\'Urbanisation par D√©partement',
                 fontsize=18, fontweight='bold', y=0.98)
    
    # Palette cat√©gorielle
    colors = {
        'Tr√®s faible (<1%)': '#2ecc71',      # Vert
        'Faible (1-5%)': '#f39c12',         # Orange clair
        'Mod√©r√©e (5-10%)': '#e67e22',       # Orange
        '√âlev√©e (10-20%)': '#e74c3c',       # Rouge clair
        'Tr√®s √©lev√©e (>20%)': '#c0392b'     # Rouge fonc√©
    }
    
    # Tracer chaque cat√©gorie
    for cat in labels:
        gdf_cat = gdf[gdf['CATEGORIE'] == cat]
        if len(gdf_cat) > 0:
            gdf_cat.plot(ax=ax, color=colors[cat], edgecolor='black', linewidth=0.8,
                        label=f'{cat} ({len(gdf_cat)} depts)')
    
    # D√©partements sans donn√©es
    gdf_sans_donnees = gdf[gdf['CATEGORIE'].isna()]
    if len(gdf_sans_donnees) > 0:
        gdf_sans_donnees.plot(ax=ax, color='lightgrey', edgecolor='black',
                              linewidth=0.8, hatch='//', label=f'Pas de donn√©es ({len(gdf_sans_donnees)})')
    
    # Ajouter noms des principales villes/r√©gions
    capitales = {
        'DAKAR': (-17.4467, 14.7645),
        'THI√àS': (-16.935, 14.79),
        'SAINT-LOUIS': (-16.4896, 16.022),
        'KAOLACK': (-16.0758, 14.165),
        'ZIGUINCHOR': (-16.2819, 12.564)
    }
    
    for ville, (lon, lat) in capitales.items():
        ax.plot(lon, lat, 'v', color='darkblue', markersize=10)
        ax.annotate(ville, xy=(lon, lat), xytext=(5, 5),
                   textcoords="offset points", fontsize=10, fontweight='bold',
                   bbox=dict(boxstyle='round,pad=0.3', facecolor='white', alpha=0.9))
    
    ax.set_title('CAT√âGORISATION DU DEGR√â D\'URBANISATION', fontsize=14, fontweight='bold', pad=15)
    ax.axis('off')
    
    # L√©gende am√©lior√©e
    ax.legend(title='NIVEAU D\'URBANISATION', loc='upper left', fontsize=10,
              title_fontsize=11, framealpha=0.9, edgecolor='black')
    
    # √âchelle manuelle
    bounds = gdf.total_bounds
    scale_x = bounds[0] + (bounds[2] - bounds[0]) * 0.05
    scale_y = bounds[1] + (bounds[3] - bounds[1]) * 0.05
    scale_deg = 100 / 111
    
    ax.plot([scale_x, scale_x + scale_deg], [scale_y, scale_y], 
            color='black', linewidth=3)
    ax.plot([scale_x, scale_x], [scale_y-0.05, scale_y+0.05], 
            color='black', linewidth=2)
    ax.plot([scale_x + scale_deg, scale_x + scale_deg], [scale_y-0.05, scale_y+0.05], 
            color='black', linewidth=2)
    ax.text(scale_x + scale_deg/2, scale_y - 0.1, '100 km', 
            ha='center', va='top', fontsize=9, fontweight='bold',
            bbox=dict(boxstyle='round', facecolor='white', alpha=0.8))
    
    # Ajouter fl√®che nord
    north_x = bounds[0] + (bounds[2] - bounds[0]) * 0.95
    north_y = bounds[1] + (bounds[3] - bounds[1]) * 0.95
    ax.text(north_x, north_y, 'N', fontsize=14, fontweight='bold',
            va='center', ha='center', 
            bbox=dict(boxstyle='circle', facecolor='white', edgecolor='black'))
    
    # Statistiques des cat√©gories
    cat_stats = df_valides['CATEGORIE'].value_counts()
    stats_text = "R√âPARTITION PAR CAT√âGORIE:\n"
    total = len(df_valides)
    for cat in labels:
        count = cat_stats.get(cat, 0)
        stats_text += f"‚Ä¢ {cat.split('(')[0].strip()}: {count} depts ({count/total*100:.1f}%)\n"
    
    # Ajouter top 5 d√©partements par cat√©gorie
    stats_text += "\nTOP 5 PAR CAT√âGORIE:\n"
    for cat in ['Tr√®s √©lev√©e (>20%)', '√âlev√©e (10-20%)']:
        cat_depts = df_valides[df_valides['CATEGORIE'] == cat]
        if len(cat_depts) > 0:
            top = cat_depts.nlargest(3, 'PCT_BATI')
            stats_text += f"{cat.split('(')[0]}:\n"
            for _, dept in top.iterrows():
                stats_text += f"  - {dept['NOM_DEPT']}: {dept['PCT_BATI']:.1f}%\n"
    
    fig.text(0.02, 0.15, stats_text, fontsize=9,
             bbox=dict(boxstyle='round', facecolor='lightyellow', alpha=0.9),
             verticalalignment='top')
    
    # L√©gende de la carte
    fig.text(0.5, 0.02,
             'Source: Analyse Spatiale 2018 | ‚ñ≤ Capitales r√©gionales | Classification: PCT_BATI',
             ha='center', fontsize=9, style='italic')
    
    plt.tight_layout(rect=[0, 0.05, 1, 0.95])
    plt.savefig(DOSSIER_SORTIE / '06_carte_categories.png', dpi=300, bbox_inches='tight')
    print(f"‚úì 06_carte_categories.png")
    plt.close()
    
# ============================================
# MAIN
# ============================================

def main():
    print("\n" + "="*70)
    print("VISUALISATION URBANISATION S√âN√âGAL 2018")
    print("="*70)
    
    # Chargement
    df, df, gdf_dept, gdf_region = charger_donnees()
    
    # Si chargement √©chou√©, arr√™ter
    if df is None:
        print("\n‚ùå Impossible de continuer. Veuillez corriger les chemins.")
        print(f"   V√©rifiez votre structure de dossiers:")
        print(f"   {REPERTOIRE_BASE / 'data'}")
        return
    
    # Stats
    stats_descriptives(df)
    
    # Graphiques
    print("\n" + "="*70)
    print("G√âN√âRATION DES VISUALISATIONS")
    print("="*70 + "\n")
    
    graphique_distribution(df)
    graphique_top_departements(df)
    stats_reg = graphique_regions(df)
    
    # Cartes
    carte_departements(df, gdf_dept)
    carte_regions(df, gdf_region)
    carte_categories(df, gdf_dept)
    
    # R√©sum√©
    print("\n" + "="*70)
    print("‚úÖ VISUALISATIONS TERMIN√âES")
    print("="*70)
    print(f"\nüìÇ Fichiers dans: {DOSSIER_SORTIE}")
    print("\nüìã Fichiers g√©n√©r√©s:")
    print("  1. 01_distribution.png - Distribution globale")
    print("  2. 02_top_departements.png - Top/Bottom 20")
    print("  3. 03_analyse_regions.png - Analyse r√©gionale")
    print("  4. 04_carte_departements.png - Carte d√©partements")
    print("  5. 05_carte_regions.png - Carte r√©gions")
    print("  6. 06_carte_categories.png - Carte cat√©gories")
    print("\n‚ú® Analyse termin√©e avec succ√®s!")

if __name__ == "__main__":
    main()


VISUALISATION URBANISATION S√âN√âGAL 2018
CHARGEMENT DES DONN√âES
üìÇ V√©rification des fichiers...
  - CSV: C:\Users\HP\Documents\ISEP3\Semestre 1_CT\Stat\Stat_Spatiale\TP6\data\senegal_unifie_467_20251222_141659.csv
    Existe: ‚úì
  - Shapefile r√©gions: C:\Users\HP\Documents\ISEP3\Semestre 1_CT\Stat\Stat_Spatiale\TP6\data\GADM\gadm\gadm41_SEN_shp\gadm41_SEN_1.shp
    Existe: ‚úì
  - Shapefile d√©partements: C:\Users\HP\Documents\ISEP3\Semestre 1_CT\Stat\Stat_Spatiale\TP6\data\GADM\gadm\gadm41_SEN_shp\gadm41_SEN_2.shp
    Existe: ‚úì

üìä Chargement CSV...
‚úì 45 d√©partements, 45 valides

üó∫Ô∏è  Chargement shapefiles GADM...
‚úì 45 d√©partements, 14 r√©gions
‚úì Dossier sortie: C:\Users\HP\Documents\ISEP3\Semestre 1_CT\Stat\Stat_Spatiale\TP6\visualisations

üìä STATISTIQUES DESCRIPTIVES

Moyenne: 44.87% | M√©diane: 43.40%
Min: 6.29% | Max: 94.52%
√âcart-type: 25.89%

G√âN√âRATION DES VISUALISATIONS

‚úì 01_distribution.png
‚úì 02_top_departements.png
‚úì 03_analyse_regions.pn