# Analyse de la R√©partition des √âquipements Sportifs dans le Val-d'Oise

Le d√©partement du Val-d'Oise, situ√© dans la r√©gion √éle-de-France, dispose d'un patrimoine riche en √©quipements sportifs. L'analyse de ces √©quipements est essentielle pour comprendre les besoins et les disparit√©s en mati√®re d'infrastructures sportives au sein des communes. Les donn√©es utilis√©es proviennent du site data.iledefrance.fr, qui met √† disposition le recensement des √©quipements sportifs dans le Val-d'Oise sous format CSV. L'URL source est : http://data.iledefrance.fr/explore/dataset/recensement_des_equipements_sportifs_dans_le_val-d_oise/download?format=csv.

L'objectif de cette analyse est de compter le nombre d'√©quipements sportifs par commune en utilisant le code INSEE ("new_code"). Cela permettra d'avoir une vision claire de la r√©partition de ces √©quipements et d'identifier les communes qui en sont les mieux pourvues ou qui pourraient n√©cessiter un renforcement de leurs infrastructures sportives.


## M√©thodologie

La m√©thodologie utilis√©e pour cette analyse repose sur une requ√™te SQL ex√©cut√©e via DuckDB, un outil d'analyse de donn√©es en colonnes. La requ√™te a consist√© √† regrouper les √©quipements sportifs par leur code INSEE ("new_code"), √† compter le nombre d'√©quipements pour chaque groupe, et √† ordonner les r√©sultats par code INSEE. Les r√©sultats ont ensuite √©t√© utilis√©s pour cr√©er une carte choropleth repr√©sentant la r√©partition des √©quipements sportifs par commune.


Les donn√©es ont √©t√© enrichies avec des donn√©es g√©ospatiales provenant d'un fichier GeoJSON contenant les contours des communes fran√ßaises. L'utilisation de biblioth√®ques telles que Pandas, Geopandas, et Plotly Express a permis de manipuler et de visualiser efficacement les donn√©es.


Ainsi, cette analyse propose une visualisation claire et interactive de la r√©partition des √©quipements sportifs dans le Val-d'Oise, permettant une meilleure compr√©hension des disparit√©s g√©ographiques et facilitant la prise de d√©cision pour les acteurs locaux.

## üîß Configuration

In [1]:
# Installation et imports
import duckdb as ddb
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

## ü¶Ü Chargement du dataset avec Duckdb

In [1]:
# Fonction de chargement compl√®te (bas√©e sur load_file_from_url_lite)
def load_file_from_url_lite(url_dataset="", loader="read_csv_auto", options="", nom_table="loaded_dataset", safe_mode=False):
    ddb.execute("install spatial")
    ddb.execute("load spatial")
    ddb.execute("INSTALL h3 FROM community")
    ddb.execute("LOAD h3")
    ddb.execute("install webbed from community;")
    ddb.execute("load webbed")
    ddb.execute("set force_download=True")
    ddb.execute(f"drop table if exists {nom_table}")   
    
    # D√©tection automatique du type de fichier
    if 'csv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'tsv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'txt' in url_dataset: 
        loader = "read_csv_auto"
    elif 'parquet' in url_dataset: 
        loader = "read_parquet"
    elif 'json' in url_dataset: 
        loader = "read_json_auto"
    elif 'xls' in url_dataset or 'xlsx' in url_dataset: 
        loader = "st_read"
    elif 'shp' in url_dataset: 
        loader = "st_read"
    elif 'geojson' in url_dataset: 
        loader = "st_read"
    elif 'xml' in url_dataset: 
        loader = "read_xml"
    elif 'html' in url_dataset: 
        loader = "read_html"
    else: 
        raise ValueError(f"Type de fichier non support√© pour {url_dataset}")
    
    if options=="": 
        options = "" 
    if 'csv' in url_dataset and safe_mode==True: 
        options = ", all_varchar=1" 
    if nom_table=="": 
        nom_table = "loaded_dataset"
    
    try:
        status = ddb.sql(f"""
            create or replace table {nom_table} as select *
            from
            {loader}("{url_dataset}" {options})
        """)
        return status
    except Exception as e:
        return f"Erreur au chargement du fichier : {str(e)}"

def run_query(sql):
    return ddb.sql(sql.replace("`"," ")).to_df()

# Chargement des donn√©es
load_file_from_url_lite("http://data.iledefrance.fr/explore/dataset/recensement_des_equipements_sportifs_dans_le_val-d_oise/download?format=csv", safe_mode=True)
print("‚úÖ Donn√©es charg√©es avec succ√®s")

## üîç Analyse SQL

Cette requ√™te utilise des techniques SQL pour extraire et transformer les donn√©es de mani√®re efficace.

In [2]:
# Ex√©cution de la requ√™te
df = run_query(""" SELECT 
  "new_code" AS code_insee,
  COUNT(*) AS nombre_equipements
FROM 
  loaded_dataset
GROUP BY 
  "new_code"
ORDER BY 
  "new_code" """)
print(f"R√©sultats : {len(df)} lignes")
df.head()

## üìà Visualisation

La biblioth√®que principale utilis√©e est Plotly Express, qui permet de cr√©er des visualisations interactives et personnalisables. Cette technologie est adapt√©e car elle offre une grande flexibilit√© pour repr√©senter des donn√©es g√©ospatiales, comme ici une carte choropl√®the repr√©sentant la r√©partition des √©quipements sportifs par commune. Cela permet une exploration interactive des donn√©es.

In [3]:
import pandas as pd
import duckdb as ddb
import pandas as pd
import geopandas as gpd
import plotly.express as px
import requests
import io

url_communes = 'https://france-geojson.gregoiredavid.fr/repo/communes.geojson'
communes_geojson = requests.get(url_communes).content
communes = gpd.read_file(io.BytesIO(communes_geojson))
communes["code"] = communes["code"].astype(str)
df["code_insee"] = df["code_insee"].astype(str)

carto = communes.merge(df, left_on="code", right_on="code_insee")

carto = carto[~carto["nombre_equipements"].isna()]

carto["geometry"] = carto["geometry"].simplify(0.01)

fig = px.choropleth_mapbox(
    carto,
    geojson=carto.geometry,
    locations=carto.index,
    color="nombre_equipements",
    color_continuous_scale="YlGn",
    range_color=[carto["nombre_equipements"].min(), carto["nombre_equipements"].max()],
    mapbox_style="carto-positron",
    center={"lat": carto.centroid.y.mean(), "lon": carto.centroid.x.mean()},
    zoom=9.2,
    hover_data={"nom": True, "code": True, "nombre_equipements": True},
    labels={"nombre_equipements": "√âquipements", "nom": "Commune", "code": "Code INSEE"},
    width=900,
    height=600
)

fig.update_layout(
    title_text="R√©partition des √©quipements sportifs par commune",
    title_font_size=17,
    title_font_family="Segoe UI",
    margin=dict(l=0, r=0, t=35, b=0),
    coloraxis_colorbar_title_text="Nb √âquip."
)

dataviz = fig
dataviz

---
*Made with ‚ù§Ô∏è and with [duckit.fr](https://duckit.fr) - [Ali Hmaou](https://www.linkedin.com/in/ali-hmaou-6b7b73146/)*