# Analyse de la R√©partition des √âlus par D√©partement et par Sexe en France


Le contexte de cette analyse est la compr√©hension de la r√©partition g√©ographique et d√©mographique des √©lus en France. Le fichier source utilis√© provient du R√©pertoire National des √âlus, disponible sur le site data.gouv.fr √† l'adresse https://static.data.gouv.fr/resources/repertoire-national-des-elus-1/20250613-142903/elus-maires-mai.csv. Ce r√©pertoire contient des informations d√©taill√©es sur les √©lus, notamment leurs donn√©es personnelles, professionnelles et les d√©tails de leurs mandats.


L'objectif de cette analyse est d'explorer la r√©partition des √©lus par d√©partement et par sexe, afin de mettre en √©vidence les disparit√©s g√©ographiques et de genre parmi les √©lus fran√ßais. Cette analyse permettra de comprendre comment les √©lus sont r√©partis √† travers les diff√©rents d√©partements de France et d'identifier les tendances en mati√®re de repr√©sentation des femmes et des hommes dans la sph√®re politique locale.


## M√©thodologie


La m√©thodologie utilis√©e pour cette analyse implique plusieurs √©tapes. Tout d'abord, les donn√©es sont charg√©es et trait√©es √† l'aide de requ√™tes SQL pour extraire les informations n√©cessaires. Une requ√™te sp√©cifique a √©t√© g√©n√©r√©e pour compter le nombre d'√©lus par d√©partement et par sexe. Les donn√©es r√©sultantes sont ensuite trait√©es et transform√©es pour √™tre utilis√©es dans une visualisation g√©ographique interactive. Cette visualisation utilise une carte de France divis√©e par d√©partements, o√π chaque d√©partement est color√© en fonction du ratio de femmes √©lues. La visualisation est cr√©√©e √† l'aide de la biblioth√®que Plotly Express et des donn√©es g√©ographiques provenant d'un fichier GeoJSON.

## üîß Configuration

In [1]:
# Installation et imports
import duckdb as ddb
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

## ü¶Ü Chargement du dataset avec Duckdb

In [1]:
# Fonction de chargement compl√®te (bas√©e sur load_file_from_url_lite)
def load_file_from_url_lite(url_dataset="", loader="read_csv_auto", options="", nom_table="loaded_dataset", safe_mode=False):
    ddb.execute("install spatial")
    ddb.execute("load spatial")
    ddb.execute("INSTALL h3 FROM community")
    ddb.execute("LOAD h3")
    ddb.execute("install webbed from community;")
    ddb.execute("load webbed")
    ddb.execute("set force_download=True")
    ddb.execute(f"drop table if exists {nom_table}")   
    
    # D√©tection automatique du type de fichier
    if 'csv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'tsv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'txt' in url_dataset: 
        loader = "read_csv_auto"
    elif 'parquet' in url_dataset: 
        loader = "read_parquet"
    elif 'json' in url_dataset: 
        loader = "read_json_auto"
    elif 'xls' in url_dataset or 'xlsx' in url_dataset: 
        loader = "st_read"
    elif 'shp' in url_dataset: 
        loader = "st_read"
    elif 'geojson' in url_dataset: 
        loader = "st_read"
    elif 'xml' in url_dataset: 
        loader = "read_xml"
    elif 'html' in url_dataset: 
        loader = "read_html"
    else: 
        raise ValueError(f"Type de fichier non support√© pour {url_dataset}")
    
    if options=="": 
        options = "" 
    if 'csv' in url_dataset and safe_mode==True: 
        options = ", all_varchar=1" 
    if nom_table=="": 
        nom_table = "loaded_dataset"
    
    try:
        status = ddb.sql(f"""
            create or replace table {nom_table} as select *
            from
            {loader}("{url_dataset}" {options})
        """)
        return status
    except Exception as e:
        return f"Erreur au chargement du fichier : {str(e)}"

def run_query(sql):
    return ddb.sql(sql.replace("`"," ")).to_df()

# Chargement des donn√©es
load_file_from_url_lite("https://static.data.gouv.fr/resources/repertoire-national-des-elus-1/20250613-142903/elus-maires-mai.csv", safe_mode=True)
print("‚úÖ Donn√©es charg√©es avec succ√®s")

## üîç Analyse SQL

Cette requ√™te utilise des techniques SQL pour extraire et transformer les donn√©es de mani√®re efficace.

In [2]:
# Ex√©cution de la requ√™te
df = run_query(""" SELECT 
 SUBSTR("Code du d√©partement", 1, 2) AS code_dept,
 "Code sexe" AS sexe,
 COUNT(*) AS nb_elus
FROM 
 loaded_dataset
GROUP BY 
 1, "Code sexe"
ORDER BY 
 code_dept, sexe """)
print(f"R√©sultats : {len(df)} lignes")
df.head()

## üìà Visualisation

La biblioth√®que principale utilis√©e est Plotly Express, qui est adapt√©e pour cr√©er des visualisations interactives et attractives. Dans ce cas, elle est utilis√©e pour cr√©er une carte choropleth interactive qui repr√©sente le ratio de femmes √©lues par d√©partement en France. Cela permet une exploration facile et intuitive des donn√©es g√©ographiques.

In [3]:
import pandas as pd
import duckdb as ddb
import plotly.express as px
import geopandas as gpd
import pandas as pd
import requests

# R√©cup√©ration du GeoJSON des d√©partements fran√ßais
url_geo = "https://france-geojson.gregoiredavid.fr/repo/departements.geojson"
gdf_depts = gpd.read_file(url_geo)

# Pr√©paration des donn√©es : pivot pour avoir le nombre d'√©lus par sexe par d√©partement
df_pivot = df.pivot(index='code_dept', columns='sexe', values='nb_elus').reset_index()
df_pivot['ratio_femmes_pct'] = (df_pivot['F'] / (df_pivot['F'] + df_pivot['M']) * 100).round(1)
df_pivot['nb_elus_total'] = df_pivot['F'] + df_pivot['M']

# Fusion avec les donn√©es g√©ographiques
gdf_depts['code'] = gdf_depts['code'].astype(str).str.zfill(2)
df_pivot['code_dept'] = df_pivot['code_dept'].astype(str).str.zfill(2)
gdf_merged = gdf_depts.merge(df_pivot, left_on='code', right_on='code_dept', how='inner')

# Cr√©ation de la carte interactive
dataviz = px.choropleth_mapbox(
    gdf_merged,
    geojson=gdf_merged.geometry.__geo_interface__,
    locations=gdf_merged.index,
    color='ratio_femmes_pct',
    color_continuous_scale='RdBu',
    range_color=[gdf_merged['ratio_femmes_pct'].min(), gdf_merged['ratio_femmes_pct'].max()],
    mapbox_style="carto-positron",
    zoom=4.5,
    center={"lat": 46.5, "lon": 2.0},
    opacity=0.7,
    labels={'ratio_femmes_pct': 'Ratio femmes (%)'},
    hover_data={
        'nom': True,
        'F': ':.0f',
        'M': ':.0f',
        'nb_elus_total': ':.0f',
        'ratio_femmes_pct': ':.1f%'
    },
    title="R√©partition des √©lus par d√©partement et par sexe - Ratio de femmes √©lues (%)"
)

dataviz.update_layout(
    margin=dict(l=20, r=20, t=40, b=20),
    font_family="Arial",
    title_font_size=14,
    title_x=0.5
)

# Inversion de l'√©chelle de couleurs pour mettre en √©vidence les femmes
dataviz.update_traces(
    colorbar=dict(
        title='Ratio<br>femmes √©lues (%)',
        ticksuffix='%',
        len=0.7,
        yanchor='middle',
        y=0.5
    )
)
dataviz

---
*Made with ‚ù§Ô∏è and with [duckit.fr](https://duckit.fr) - [Ali Hmaou](https://www.linkedin.com/in/ali-hmaou-6b7b73146/)*