# Analyse G√©o-Spatiale : √Ä la recherche du terrain de football parfait dans le Val-d'Oise

## Contexte et Objectifs

Ce notebook a pour ambition de transformer un jeu de donn√©es brutes en une carte interactive et parlante. En nous appuyant sur le **Recensement des √âquipements Sportifs (RES)**, disponible en open data sur le portail de la r√©gion √éle-de-France (source : [data.iledefrance.fr](http://data.iledefrance.fr/explore/dataset/recensement_des_equipements_sportifs_dans_le_val-d_oise/download?format=csv)), nous allons cartographier l'ensemble des infrastructures o√π la pratique du football est possible dans le d√©partement du Val-d'Oise (95). L'objectif est de cr√©er un outil visuel, simple et direct, permettant √† quiconque ‚Äì un joueur amateur, un club local, un parent ou m√™me un urbaniste ‚Äì d'identifier rapidement les terrains disponibles √† proximit√©.

Au-del√† de la simple localisation, cette analyse est une d√©monstration de la puissance de la data science appliqu√©e au bien commun. En quelques lignes de code, nous allons filtrer, structurer et visualiser une information d'int√©r√™t public pour la rendre accessible et utile. Ce projet illustre comment des donn√©es ouvertes peuvent √™tre mobilis√©es pour r√©pondre √† des questions tr√®s concr√®tes : o√π se trouve le terrain couvert le plus proche pour s'entra√Æner l'hiver ? Quels sont les types de surface (synth√©tique, gazon naturel) disponibles dans ma commune ? Ce notebook sert de guide pas-√†-pas pour passer de la donn√©e √† la d√©cision.

## Exploration du jeu de donn√©es

### Description fonctionnelle du fichier
Ce jeu de donn√©es est un inventaire exhaustif des installations et des √©quipements sportifs localis√©s dans le d√©partement du Val-d'Oise (95). Il offre une vision √† la fois macroscopique (par installation, comme un complexe sportif) et microscopique (par √©quipement, comme un court de tennis sp√©cifique au sein du complexe). La richesse des informations permet d'analyser le parc sportif sous de multiples angles : g√©ographique, technique, accessibilit√©, v√©tust√©, et usages. C'est un outil strat√©gique pour l'am√©nagement du territoire, l'√©valuation des politiques publiques sportives et l'analyse des in√©galit√©s territoriales en mati√®re d'acc√®s au sport.

### Champs notables
- **Hi√©rarchie des donn√©es** : Les colonnes pr√©fix√©es par `inst_` d√©crivent l'installation (le "contenant", ex: Gymnase L√©o Lagrange), tandis que celles pr√©fix√©es par `equip_` d√©crivent un √©quipement sp√©cifique au sein de cette installation (le "contenu", ex: le terrain de basket). La granularit√© est donc √† l'√©quipement.
- **G√©olocalisation** : Les colonnes `longitude` et `latitude` sont fondamentales pour toute analyse spatiale. Elles permettent de cartographier pr√©cis√©ment chaque √©quipement. La colonne `coordonnees` est une concat√©nation, mais il est pr√©f√©rable d'utiliser les champs d√©di√©s.
- **Accessibilit√©** : Une s√©rie de champs bool√©ens (`equip_pmr_acc`, `equip_pmr_sanit`, etc.) et le champ textuel `accessibilite_aux_personnes_a_mobilite_reduite` fournissent des informations cruciales sur l'adaptation des infrastructures aux personnes en situation de handicap. C'est une mine d'or pour les √©tudes sur l'inclusion.
- **Caract√©ristiques techniques** : Des colonnes comme `equip_type_name`, `equip_sol`, `equip_nature` (Int√©rieur/D√©couvert), `equip_surf`, `equip_long`, `equip_larg` permettent de qualifier tr√®s finement chaque √©quipement.
- **V√©tust√© et maintenance** : `equip_service_date`, `equip_service_periode`, et `equip_travaux_date` sont des indicateurs temporels pr√©cieux pour √©valuer l'√¢ge du parc, anticiper les besoins de r√©novation et analyser les vagues d'investissement pass√©es.
- **Contexte socio-territorial** : La pr√©sence des champs `qpv` (Quartier Prioritaire de la politique de la Ville) et `dens_lib` (niveau de densit√© de la commune) permet de croiser l'offre sportive avec des indicateurs de politique de la ville et de typologie de territoire.

## M√©thodologie

Notre d√©marche se d√©compose en trois √©tapes cl√©s, formant un pipeline de traitement de donn√©es classique et efficace :

1.  **Chargement et Requ√™tage des Donn√©es** : Apr√®s avoir charg√© le jeu de donn√©es complet, nous utilisons la puissance du SQL pour interroger directement le dataframe en m√©moire. Nous r√©digeons une requ√™te pr√©cise pour filtrer uniquement les √©quipements du Val-d'Oise (`dep_code` = '95'), li√©s √† la pratique du football (`activites` LIKE '%Football%'), et disposant de coordonn√©es g√©ographiques valides.
2.  **Pr√©paration des Donn√©es** : Le r√©sultat de la requ√™te est un jeu de donn√©es propre et cibl√©, contenant toutes les informations n√©cessaires pour notre cartographie : nom de l'installation, de l'√©quipement, nature (couvert/d√©couvert), type de sol et coordonn√©es.
3.  **Visualisation Cartographique** : √Ä l'aide de la biblioth√®que Folium, nous projetons ces points de donn√©es sur une carte interactive. Chaque terrain est repr√©sent√© par un marqueur cliquable, dont la couleur varie s'il est couvert ou en plein air. Une fen√™tre contextuelle (popup) r√©v√®le les d√©tails de chaque √©quipement, offrant une lecture riche et imm√©diate de l'information.

## Mise en ≈ìuvre de l'analyse

### √âtape 1 : Extraction des donn√©es pertinentes via SQL

La premi√®re √©tape consiste √† sculpter notre jeu de donn√©es. Plut√¥t que de manipuler l'ensemble du fichier, nous formulons une requ√™te SQL qui agit comme un scalpel pour extraire avec pr√©cision la substantifique moelle : les terrains de football du 95. La clause `ILIKE '%Football%'` garantit que nous capturons toutes les variations (ex: "Football", "Football √† 7", etc.), tandis que les filtres sur les coordonn√©es assurent la qualit√© des donn√©es pour la cartographie.

```sql
SELECT
    "inst_nom" AS nom_installation,
    "equip_nom" AS nom_equipement,
    "equip_nature" AS nature_equipement,
    "equip_sol" AS type_sol,
    "activites",
    CAST("latitude" AS DOUBLE) AS latitude,
    CAST("longitude" AS DOUBLE) AS longitude
FROM
    loaded_dataset
WHERE
    "dep_code" = '95'
    AND "activites" ILIKE '%Football%'
    AND "latitude" IS NOT NULL
    AND "longitude" IS NOT NULL
ORDER BY
    nom_installation
```

Le r√©sultat est un dataframe `pandas` parfaitement format√©, pr√™t √† √™tre visualis√©.

### √âtape 2 : Cr√©ation de la carte interactive

C'est ici que la magie op√®re. Nous transformons notre tableau de donn√©es en une carte vivante. Le code ci-dessous initialise une carte centr√©e sur le Val-d'Oise, puis parcourt chaque ligne de notre dataframe pour y placer un marqueur. Pour rendre la carte plus intuitive, nous utilisons des ic√¥nes de football et un code couleur simple : vert pour les terrains d√©couverts et orange pour les terrains int√©rieurs. Chaque marqueur, au survol, affiche le nom de l'installation, et au clic, r√©v√®le une fiche d√©taill√©e de l'√©quipement.

```python
import pandas as pd
import duckdb as ddb
import folium
from folium.features import CustomIcon
import pandas as pd

# En supposant que le dataframe 'df' est le r√©sultat de la requ√™te SQL pr√©c√©dente

# Filtrer les √©quipements de football (redondant si d√©j√† fait en SQL, mais bonne pratique)
mask = df['activites'].str.contains('Football', case=False, na=False)
g = df[mask].copy()

# Trier par nom d'installation pour une meilleure lisibilit√© des popups
g = g.sort_values(['nom_installation', 'nom_equipement'])

# Coordonn√©es du centre pour la vue initiale
center_coords = [g['latitude'].mean(), g['longitude'].mean()]

# Cr√©er la carte
dataviz = folium.Map(
    location=center_coords,
    zoom_start=10,
    tiles='CartoDB positron'
)

# Fonction pour d√©finir des ic√¥nes personnalis√©es
def get_icon(nature):
    # Couleurs par nature d'√©quipement
    color_map = {
        'D√©couvert': 'green',
        'Int√©rieur': 'orange',
    }
    color = color_map.get(nature, 'gray')
    return folium.Icon(icon='futbol', prefix='fa', color=color)

# Ajouter les marqueurs √† la carte
for _, row in g.iterrows():
    folium.Marker(
        location=[row['latitude'], row['longitude']],
        popup=folium.Popup(
            html=f"""
            <div style="font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif; font-size: 14px;">
                <h4 style="margin: 5px 0;">{row['nom_installation']}</h4>
                <p style="margin: 3px 0;"><strong>√âquipement :</strong> {row['nom_equipement']}</p>
                <p style="margin: 3px 0;"><strong>Nature :</strong> {row['nature_equipement']}</p>
                <p style="margin: 3px 0;"><strong>Surface :</strong> {row['type_sol']}</p>
                <p style="margin: 3px 0;"><strong>Activit√©s :</strong> {row['activites']}</p>
            </div>
            """,
            max_width=300
        ),
        tooltip=row['nom_installation'],
        icon=get_icon(row['nature_equipement'])
    ).add_to(dataviz)

# Ajouter une l√©gende pour une meilleure compr√©hension
legend_html = '''
     <div style="position: fixed; 
     bottom: 50px; left: 50px; width: 180px; height: 90px; 
     background-color: white; z-index: 1000; font-size: 14px;
     border:2px solid grey; border-radius: 5px;
     padding: 10px;
     font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif;">
     <p style="margin: 5px;"><i class="fa fa-futbol" style="color:green;"></i> Terrains D√©couverts</p>
     <p style="margin: 5px;"><i class="fa fa-futbol" style="color:orange;"></i> Terrains Int√©rieurs</p>
     </div>
'''
dataviz.get_root().html.add_child(folium.Element(legend_html))

# Afficher la carte
# dataviz
```

## Pistes d'exploration et analyses compl√©mentaires

Cette carte n'est qu'un point de d√©part. La richesse du jeu de donn√©es initial ouvre la voie √† des analyses bien plus pouss√©es qui pourraient inspirer des politiques publiques ou des strat√©gies de d√©veloppement.

1.  **Analyse de la "fracture sportive"** : Corr√©ler la densit√© d'√©quipements par type (`equip_type_famille`) avec la pr√©sence dans un `qpv`. On pourrait ainsi identifier les quartiers sous-dot√©s en certains types d'infrastructures (piscines, dojos, etc.).
2.  **Mod√©lisation pr√©dictive de la v√©tust√©** : Utiliser `equip_service_date` et `equip_travaux_date` comme variables pour construire un mod√®le qui pr√©dit les besoins de r√©novation. On pourrait enrichir le mod√®le avec `equip_utilisateur` (un √©quipement tr√®s utilis√© par les scolaires s'use diff√©remment) pour affiner les pr√©dictions.
3.  **Analyse de l'accessibilit√© r√©elle** : Au-del√† du bool√©en `inst_acc_handi_bool`, on peut cr√©er un score d'accessibilit√© composite en agr√©geant les multiples champs `equip_pmr_*` pour chaque installation. La cartographie de ce score r√©v√©lerait les zones les mieux et les moins bien adapt√©es.
4.  **Clustering des communes sportives** : Appliquer un algorithme de clustering (type K-Means) sur les communes en se basant sur la diversit√© et la quantit√© de leurs √©quipements. Cela permettrait de d√©gager des profils types de communes ("la commune du tennis", "la commune des sports collectifs", "le p√¥le aquatique", etc.).
5.  **Analyse d'ad√©quation offre/demande potentielle** : En croisant ces donn√©es avec des donn√©es d√©mographiques de l'INSEE (pyramide des √¢ges, revenus), on pourrait √©valuer si l'offre d'√©quipements est en phase avec le profil des habitants d'un territoire donn√©. Par exemple, y a-t-il assez de city-stades dans les zones √† forte population jeune ?

## Mots cl√©s
#SportPourTous #OpenData #DataAnalyse #ValDOise #Infrastructures #Am√©nagementTerritoire #PolitiquesPubliquesüìà #Accessibilit√©‚ôøÔ∏è #Cartographieüó∫Ô∏è #G√©omarketing

## üîß Configuration

In [1]:
# Installation et imports
import duckdb as ddb
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

## ü¶Ü Chargement du dataset avec Duckdb

In [1]:
# Fonction de chargement compl√®te (bas√©e sur load_file_from_url_lite)
def load_file_from_url_lite(url_dataset="", loader="read_csv_auto", options="", nom_table="loaded_dataset", safe_mode=False):
    ddb.execute("install spatial")
    ddb.execute("load spatial")
    ddb.execute("INSTALL h3 FROM community")
    ddb.execute("LOAD h3")
    ddb.execute("install webbed from community;")
    ddb.execute("load webbed")
    ddb.execute("set force_download=True")
    ddb.execute(f"drop table if exists {nom_table}")   
    
    # D√©tection automatique du type de fichier
    if 'csv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'tsv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'txt' in url_dataset: 
        loader = "read_csv_auto"
    elif 'parquet' in url_dataset: 
        loader = "read_parquet"
    elif 'json' in url_dataset: 
        loader = "read_json_auto"
    elif 'xls' in url_dataset or 'xlsx' in url_dataset: 
        loader = "st_read"
    elif 'shp' in url_dataset: 
        loader = "st_read"
    elif 'geojson' in url_dataset: 
        loader = "st_read"
    elif 'xml' in url_dataset: 
        loader = "read_xml"
    elif 'html' in url_dataset: 
        loader = "read_html"
    else: 
        raise ValueError(f"Type de fichier non support√© pour {url_dataset}")
    
    if options=="": 
        options = "" 
    if 'csv' in url_dataset and safe_mode==True: 
        options = ", all_varchar=1" 
    if nom_table=="": 
        nom_table = "loaded_dataset"
    
    try:
        status = ddb.sql(f"""
            create or replace table {nom_table} as select *
            from
            {loader}("{url_dataset}" {options})
        """)
        return status
    except Exception as e:
        return f"Erreur au chargement du fichier : {str(e)}"

def run_query(sql):
    return ddb.sql(sql.replace("`"," ")).to_df()

# Chargement des donn√©es
load_file_from_url_lite("http://data.iledefrance.fr/explore/dataset/recensement_des_equipements_sportifs_dans_le_val-d_oise/download?format=csv", safe_mode=True)
print("‚úÖ Donn√©es charg√©es avec succ√®s")

## üîç Analyse SQL

Cette requ√™te utilise des techniques SQL pour extraire et transformer les donn√©es de mani√®re efficace.

In [2]:
# Ex√©cution de la requ√™te
df = run_query(""" SELECT
    "inst_nom" AS nom_installation,
    "equip_nom" AS nom_equipement,
    "equip_nature" AS nature_equipement,
    "equip_sol" AS type_sol,
    "activites",
    CAST("latitude" AS DOUBLE) AS latitude,
    CAST("longitude" AS DOUBLE) AS longitude
FROM
    loaded_dataset
WHERE
    "dep_code" = '95'
    AND "activites" ILIKE '%Football%'
    AND "latitude" IS NOT NULL
    AND "longitude" IS NOT NULL
ORDER BY
    nom_installation """)
print(f"R√©sultats : {len(df)} lignes")
df.head()

## üìà Visualisation

Cette datavisualisation utilise la biblioth√®que Folium pour cr√©er une carte interactive, un choix id√©al pour repr√©senter des donn√©es g√©ographiques. L'utilisation de marqueurs personnalis√©s et de couleurs distinctes permet de localiser rapidement les terrains de football et d'identifier s'ils sont couverts ou en plein air, rendant l'information dense accessible et intuitive.

In [3]:
import pandas as pd
import duckdb as ddb
import folium
from folium.features import CustomIcon
import pandas as pd

# Filtrer les √©quipements de football
mask = df['activites'].str.contains('Football', case=False, na=False)
g = df[mask].copy()

# Trier par nom d'installation pour une meilleure lisibilit√© des popups
g = g.sort_values(['nom_installation', 'nom_equipement'])

# Coordonn√©es du centre
center_coords = [g['latitude'].mean(), g['longitude'].mean()]

# Cr√©er la carte
dataviz = folium.Map(
    location=center_coords,
    zoom_start=11,
    tiles='CartoDB positron'
)

# D√©finir des ic√¥nes personnalis√©es par type d'√©quipement
def get_icon(nature):
    # Couleurs par nature d'√©quipement
    color_map = {
        'D√©couvert': 'green',
        'Int√©rieur': 'orange',
    }
    color = color_map.get(nature, 'gray')
    return folium.Icon(icon='futbol', prefix='fa', color=color)

# Ajouter les marqueurs
for _, row in g.iterrows():
    folium.Marker(
        location=[row['latitude'], row['longitude']],
        popup=folium.Popup(
            html=f"""
            <div style="font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif; font-size: 14px;">
                <h4 style="margin: 5px 0;">{row['nom_installation']}</h4>
                <p style="margin: 3px 0;"><strong>√âquipement :</strong> {row['nom_equipement']}</p>
                <p style="margin: 3px 0;"><strong>Nature :</strong> {row['nature_equipement']}</p>
                <p style="margin: 3px 0;"><strong>Surface :</strong> {row['type_sol']}</p>
                <p style="margin: 3px 0;"><strong>Activit√©s :</strong> {row['activites']}</p>
            </div>
            """,
            max_width=300
        ),
        tooltip=row['nom_installation'],
        icon=get_icon(row['nature_equipement'])
    ).add_to(dataviz)

# Ajouter une l√©gende
legend_html = '''
     <div style="position: fixed; 
     bottom: 50px; left: 50px; width: 180px; height: 90px; 
     background-color: white; z-index: 1000; font-size: 14px;
     border:2px solid grey; border-radius: 5px;
     padding: 10px;
     font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif;">
     <p style="margin: 5px;"><i class="fa fa-futbol" style="color:green;"></i> D√©couvert</p>
     <p style="margin: 5px;"><i class="fa fa-futbol" style="color:orange;"></i> Int√©rieur</p>
     </div>
'''
dataviz.get_root().html.add_child(folium.Element(legend_html))
dataviz

---
*Made with ‚ù§Ô∏è and with [duckit.fr](https://duckit.fr) - [Ali Hmaou](https://www.linkedin.com/in/ali-hmaou-6b7b73146/)*