# TD MAUP - M2 IGAST

## Compr√©hension du ph√©nom√®ne √† travers un cas pratique

Nous allons maintenant illustrer le ph√©nom√®ne du MAUP en analysant le jeu de donn√©es sur le taux de boisement en France √† diff√©rentes √©chelles g√©ographiques.

---


# 1 - Chargement et structure des donn√©es

L'objectif de cette section est de charger les donn√©es g√©ographiques sur le taux de boisement en France √† diff√©rentes √©chelles d'agr√©gation :

- **Communes**
- **EPCI** (√âtablissements Publics de Coop√©ration Intercommunale)
- **D√©partements**
- **Anciennes r√©gions** (avant 2016)
- **Nouvelles r√©gions** (apr√®s 2016)


## 1.1 - Communes : *com_foret*

> `üìù` Chargez les donn√©es pour les communes dans un dataframe *com_foret*
>
> `üìù` Calculez le taux de boisement dans une nouvelle colonne *txbois* du dataframe
>
> `üìù` Examinez la structure du dataframe avec `head()`, `info()` ou `describe()`


In [None]:
# On utilise geopandas pour charger des g√©om√©tries dans un GeoDataFrame
# https://geopandas.org/
import geopandas as gpd
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import mapclassify as mc
import numpy as np

# Configuration de seaborn
sns.set_theme(style="whitegrid")
sns.set_palette("husl")

# Chemin vers les donn√©es communes
url_com = "https://github.com/fbxyz/M2_IGAST/raw/master/data/MAUP_COM_FORET_3857.geojson"

# Charger le fichier GeoJSON des communes
com_foret = gpd.read_file(url_com)

# On change la projection vers Lambert-93 (EPSG:2154)
com_foret = com_foret.to_crs(epsg=2154)

# Calculer le taux de boisement
com_foret['txbois'] = round((com_foret['surface_foret'] / com_foret['surface_com']) * 100, 1)

# Afficher les premi√®res lignes
print(com_foret.head())


## 1.2 - EPCI : *epci_foret*

> `üìù` Chargez les donn√©es pour les EPCI dans un dataframe *epci_foret*
>
> `üìù` Calculez le taux de boisement dans une nouvelle colonne *txbois* du dataframe
>
> `üìù` Examinez la structure du dataframe


In [None]:
# Chemin vers les donn√©es EPCI
url_epci = "https://github.com/fbxyz/M2_IGAST/raw/master/data/MAUP_EPCI_FORET_3857.geojson"

# TODO: Charger les donn√©es EPCI avec gpd.read_file()
# TODO: Transformer en Lambert-93 (epsg=2154)
# TODO: Calculer le taux de boisement si n√©cessaire
# TODO: Afficher les premi√®res lignes


## 1.3 - D√©partements : *dep_foret*

> `üìù` Chargez les donn√©es pour les d√©partements dans un dataframe *dep_foret*
>
> `üìù` Calculez le taux de boisement dans une nouvelle colonne *txbois* du dataframe
>
> `üìù` Examinez la structure du dataframe


In [None]:
# Chemin vers les donn√©es des d√©partements
url_dep = "https://github.com/fbxyz/M2_IGAST/raw/master/data/MAUP_DEP_FORET_3857.geojson"

# TODO: Charger les donn√©es d√©partements
# TODO: Transformer en Lambert-93
# TODO: Calculer le taux de boisement si n√©cessaire
# TODO: Afficher les premi√®res lignes


## 1.4 - Anciennes r√©gions : *oldreg_foret*

> `üìù` Chargez les donn√©es pour les anciennes r√©gions dans un dataframe *oldreg_foret*
>
> `üìù` Calculez le taux de boisement dans une nouvelle colonne *txbois* du dataframe
>
> `üìù` Examinez la structure du dataframe


In [None]:
# Chemin vers les donn√©es des anciennes r√©gions
url_oldreg = "https://github.com/fbxyz/M2_IGAST/raw/master/data/MAUP_OLDREG_FORET_3857.geojson"

# TODO: Charger les donn√©es anciennes r√©gions
# TODO: Transformer en Lambert-93
# TODO: Calculer le taux de boisement si n√©cessaire
# TODO: Afficher les premi√®res lignes


## 1.5 - Nouvelles r√©gions : *reg_foret*

> `üìù` Chargez les donn√©es pour les nouvelles r√©gions dans un dataframe *reg_foret*
>
> `üìù` Calculez le taux de boisement dans une nouvelle colonne *txbois* du dataframe
>
> `üìù` Examinez la structure du dataframe


In [None]:
# Chemin vers les donn√©es des nouvelles r√©gions
url_reg = "https://github.com/fbxyz/M2_IGAST/raw/master/data/MAUP_REG_FORET_3857.geojson"

# TODO: Charger les donn√©es nouvelles r√©gions
# TODO: Transformer en Lambert-93
# TODO: Calculer le taux de boisement si n√©cessaire
# TODO: Afficher les premi√®res lignes


---

# 2 - Cartographie des donn√©es

Pour illustrer les diff√©rents effets du MAUP, vous allez cartographier le m√™me taux de boisement en France, mais √† diff√©rents maillages.

La premi√®re carte √† la commune est montr√©e en exemple.

## Objectif :

> `üìù` Cr√©er une carte choropl√®the pour chaque niveau d'agr√©gation
>
> `üìù` Appliquer vos connaissances sur la discr√©tisation pour un rendu efficace
>
> `üìù` Observer les diff√©rences de repr√©sentation spatiale
>
> `üìù` Consultez l'aide de mapclassify si besoin : <https://pysal.org/mapclassify/>


## 2.1 - Carte par communes


In [None]:
# √âTAPE 1 : Cr√©er une figure avec matplotlib
# figsize=(15, 12) d√©finit la taille de la carte en pouces (largeur, hauteur)
fig, ax = plt.subplots(1, 1, figsize=(7, 6))

# √âTAPE 2 : Classifier les donn√©es avec Fisher-Jenks (Natural Breaks)
# Cette m√©thode minimise la variance intra-classe et maximise la variance inter-classe
# k=5 : on cr√©e 5 classes de valeurs
classifier = mc.FisherJenks(com_foret['txbois'], k=5)

# √âTAPE 3 : Cr√©er la carte choropl√®the avec geopandas
com_foret.plot(
    column='txbois',                              # Variable √† cartographier
    cmap='YlGn',                                  # Palette de couleurs (Yellow-Green)
    classification_kwds={'bins': classifier.bins}, # Utiliser les classes calcul√©es
    scheme='user_defined',                        # M√©thode de discr√©tisation personnalis√©e
    legend=True,                                  # Afficher la l√©gende
    ax=ax,                                        # Utiliser l'axe cr√©√© pr√©c√©demment
    edgecolor='grey',                             # Couleur des contours
    linewidth=0.1,                                # √âpaisseur des contours (en points)
    legend_kwds={                                 # Param√®tres de la l√©gende
        'title': 'Taux de boisement (%)',        # Titre de la l√©gende
        'loc': 'upper left',                      # Position de la l√©gende
        'frameon': True                           # Afficher un cadre autour de la l√©gende
    }
)

# √âTAPE 4 : Personnaliser la carte
ax.set_title('Taux de boisement par commune en 2024', fontsize=16, fontweight='bold')
ax.axis('off')  # Masquer les axes x et y
ax.text(0.02, 0.02, 'Source: IGN, 2024',
        transform=ax.transAxes, fontsize=8,
        verticalalignment='bottom', style='italic')

plt.tight_layout()  # Ajuster automatiquement les espacements
plt.show()


## 2.2 - Carte par EPCI

> `üìù` En vous aidant de l'exemple pr√©c√©dent, cartographiez le taux de boisement pour les EPCI
>
> `üìù` Comparez visuellement avec la carte des communes


In [None]:
# TODO: Cr√©er la carte pour les EPCI
# Inspirez-vous de l'exemple des communes ci-dessus


## 2.3 - Carte par D√©partements

> `üìù` Cartographiez le taux de boisement pour les d√©partements


In [None]:
# TODO: Cr√©er la carte pour les d√©partements


## 2.4 - Carte par Anciennes r√©gions

> `üìù` Cartographiez le taux de boisement pour les anciennes r√©gions


In [None]:
# TODO: Cr√©er la carte pour les anciennes r√©gions


## 2.5 - Carte par Nouvelles r√©gions

> `üìù` Cartographiez le taux de boisement pour les nouvelles r√©gions


In [None]:
# TODO: Cr√©er la carte pour les nouvelles r√©gions


## 2.6 - Questions

> `üìù` **Question 1 :** Qu'observez-vous sur la r√©partition du taux de boisement √† diff√©rentes √©chelles d'agr√©gation ?
>
> `üìù` **Question 2 :** Les zones identifi√©es comme fortement bois√©es restent-elles les m√™mes selon l'√©chelle ?
>
> `üìù` **Question 3 :** Quel niveau d'agr√©gation vous semble le plus pertinent pour √©tudier le taux de boisement ? Pourquoi ?


**Vos r√©ponses ici :**

1.
2.
3.



---

# 3 - Analyse univari√©e

En utilisant les acquis des cours pr√©c√©dents, r√©alisez l'analyse univari√©e du taux de boisement pour chaque maillage.

## Objectifs :

> `üìù` Calculez les valeurs centrales (moyenne, m√©diane) et les param√®tres de dispersion (√©cart-type, min, max, quartiles)
>
> `üìù` Cr√©ez des boxplots pour comparer les distributions
>
> `üìù` Analysez l'√©volution des statistiques selon l'√©chelle d'agr√©gation


## 3.1 - Communes

Exemple d'analyse pour les communes :


In [None]:
# Statistiques descriptives pour les communes
print(com_foret['txbois'].describe())

# Calcul de l'√©cart-type
print(f"\n√âcart-type : {com_foret['txbois'].std():.2f}")

# Boxplot avec seaborn
fig, ax = plt.subplots(1, 1, figsize=(8, 6))
sns.boxplot(y=com_foret['txbois'], ax=ax, color='lightgreen')
ax.set_title('Distribution du taux de boisement par commune', fontsize=14)
ax.set_ylabel('Taux de boisement (%)')
ax.set_ylim(0, 100)  # Fixer les limites de l'axe y pour permettre la comparaison entre √©chelles
plt.tight_layout()
plt.show()

## 3.2 - EPCI

> `üìù` R√©alisez l'analyse univari√©e pour les EPCI


In [None]:
# TODO: Statistiques descriptives pour EPCI
# TODO: √âcart-type
# TODO: Boxplot


## 3.3 - D√©partements

> `üìù` R√©alisez l'analyse univari√©e pour les d√©partements


In [None]:
# TODO: Statistiques descriptives pour d√©partements
# TODO: √âcart-type
# TODO: Boxplot


## 3.4 - Anciennes r√©gions

> `üìù` R√©alisez l'analyse univari√©e pour les anciennes r√©gions


In [None]:
# TODO: Statistiques descriptives pour anciennes r√©gions
# TODO: √âcart-type
# TODO: Boxplot


## 3.5 - Nouvelles r√©gions

> `üìù` R√©alisez l'analyse univari√©e pour les nouvelles r√©gions


In [None]:
# TODO: Statistiques descriptives pour nouvelles r√©gions
# TODO: √âcart-type
# TODO: Boxplot


## 3.6 - Comparaison visuelle

> `üìù` **Bonus :** Cr√©ez un graphique comparatif avec tous les boxplots c√¥te √† c√¥te


In [None]:
# √âTAPE 1 : Cr√©er un dictionnaire avec toutes les donn√©es
# Cela permet de regrouper toutes les s√©ries de taux de boisement en un seul endroit
data_dict = {
    'Communes': com_foret['txbois'],
    'EPCI': epci_foret['txbois'],
    'D√©partements': dep_foret['txbois'],
    'Anciennes_r√©gions': oldreg_foret['txbois'],
    'Nouvelles_r√©gions': reg_foret['txbois']
}

# √âTAPE 2 : Cr√©er un tableau de synth√®se des statistiques
# On utilise des list comprehensions pour calculer les stats sur chaque s√©rie
summary_stats = pd.DataFrame({
    'Maillage': list(data_dict.keys()),
    'Moyenne': [data.mean() for data in data_dict.values()],
    'M√©diane': [data.median() for data in data_dict.values()],
    '√âcart-type': [data.std() for data in data_dict.values()]
})

print("=== TABLEAU COMPARATIF DES STATISTIQUES ===")
print(summary_stats)

# √âTAPE 3 : Cr√©er un DataFrame au format "long" pour seaborn
# pd.concat() empile verticalement toutes les s√©ries
# names=['Niveau', 'index'] donne des noms aux colonnes de l'index
# reset_index() transforme l'index en colonnes normales
df_long = pd.concat(data_dict, names=['Niveau', 'index']).reset_index(name='Taux de boisement (%)')

# On garde seulement les colonnes utiles pour le graphique
df_long = df_long[['Niveau', 'Taux de boisement (%)']]

print("\n=== APER√áU DU DATAFRAME LONG ===")
print(df_long.head(10))
print(f"\nNombre total de lignes : {len(df_long)}")

# √âTAPE 4 : Cr√©er les boxplots comparatifs
fig, ax = plt.subplots(1, 1, figsize=(12, 8))
sns.boxplot(data=df_long, x='Niveau', y='Taux de boisement (%)', ax=ax, palette='Set2')
ax.set_title('Comparaison du taux de boisement selon le maillage', fontsize=14, fontweight='bold')
ax.set_xlabel('Maillage', fontsize=12)
ax.set_ylabel('Taux de boisement (%)', fontsize=12)
ax.set_ylim(0, 100)  # Fixer les limites de l'axe y pour faciliter la comparaison
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.show()

## 3.7 - Questions

> `üìù` **Question 1 :** Que constatez-vous sur l'√©volution de la moyenne du taux de boisement selon l'√©chelle ?
>
> `üìù` **Question 2 :** Comment √©volue la dispersion (√©cart-type) selon le niveau d'agr√©gation ? Pourquoi ?
>
> `üìù` **Question 3 :** Quel lien faites-vous entre ces observations et le MAUP ?


**Vos r√©ponses ici :**

1.
2.
3.
4.



---

# Fin du TD

## Pour aller plus loin

Vous pouvez explorer :

1. **L'autocorr√©lation spatiale** : Comment √©volue-t-elle selon l'√©chelle d'agr√©gation ? (indices de Moran, Geary) - Utilisez `esda` de PySAL

2. **Les corr√©lations bivari√©es** : Si vous avez d'autres variables (population, revenus), comment √©voluent les corr√©lations avec le taux de boisement selon l'√©chelle ?

3. **Le lissage spatial** : Appliquez un lissage spatial pour vous affranchir des d√©coupages administratifs - Utilisez `scipy.ndimage` ou KernelDensity de sklearn

4. **Diff√©rentes m√©thodes d'agr√©gation** : Testez diff√©rentes m√©thodes (moyennes pond√©r√©es, m√©dianes, etc.)

N'oubliez pas de consulter la pr√©sentation du cours pour r√©viser les concepts th√©oriques du MAUP !

