# Analyse des Propri√©t√©s de l'√âtat : Une Carte Choropleth pour Comprendre la R√©partition D√©partementale


L'analyse pr√©sent√©e dans ce notebook se concentre sur les donn√©es relatives aux biens immobiliers appartenant √† l'√âtat fran√ßais, issues du dataset "Inventaire Immobilier de l'√âtat" disponible sur le site data.economie.gouv.fr. Ce dataset fournit des informations d√©taill√©es sur la localisation, le type, la fonction et le minist√®re dont d√©pendent ces biens immobiliers. L'objectif principal est de pr√©parer les donn√©es pour cr√©er une carte choropleth qui illustre la r√©partition des propri√©t√©s de l'√âtat au niveau d√©partemental.


L'utilisation de ces donn√©es permet non seulement de comprendre la r√©partition g√©ographique des biens immobiliers de l'√âtat mais aussi d'analyser leur diversit√© en termes de type, de fonction et de d√©pendance minist√©rielle. La source des donn√©es, https://data.economie.gouv.fr/api/explore/v2.1/catalog/datasets/inventaire-immobilier-de-letat/exports/csv?use_labels=true, offre un aper√ßu exhaustif de l'inventaire immobilier de l'√âtat, permettant ainsi des analyses approfondies sur la base de crit√®res vari√©s.


## M√©thodologie


La m√©thodologie adopt√©e pour cette analyse implique plusieurs √©tapes cl√©s. Premi√®rement, les donn√©es sont extraites du dataset "Inventaire Immobilier de l'√âtat" et charg√©es dans un dataframe pour traitement. Ensuite, une requ√™te SQL est ex√©cut√©e via DuckDB pour agr√©ger les donn√©es par d√©partement, en calculant le nombre total de propri√©t√©s, le nombre de propri√©t√©s uniques et le nombre de minist√®res diff√©rents repr√©sent√©s dans chaque d√©partement. Les r√©sultats sont ensuite utilis√©s pour cr√©er une carte choropleth √† l'aide de Plotly Express, en superposant les donn√©es agr√©g√©es avec un GeoJSON repr√©sentant les d√©partements fran√ßais.


Les donn√©es sont ainsi visualis√©es de mani√®re √† mettre en √©vidence les disparit√©s r√©gionales dans la r√©partition des propri√©t√©s de l'√âtat, facilitant l'identification des d√©partements avec une forte concentration de biens immobiliers et permettant une analyse plus fine de la diversit√© de ces biens en fonction de diff√©rents crit√®res.

## üîß Configuration

In [1]:
# Installation et imports
import duckdb as ddb
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

## ü¶Ü Chargement du dataset avec Duckdb

In [1]:
# Fonction de chargement compl√®te (bas√©e sur load_file_from_url_lite)
def load_file_from_url_lite(url_dataset="", loader="read_csv_auto", options="", nom_table="loaded_dataset", safe_mode=False):
    ddb.execute("install spatial")
    ddb.execute("load spatial")
    ddb.execute("INSTALL h3 FROM community")
    ddb.execute("LOAD h3")
    ddb.execute("install webbed from community;")
    ddb.execute("load webbed")
    ddb.execute("set force_download=True")
    ddb.execute(f"drop table if exists {nom_table}")   
    
    # D√©tection automatique du type de fichier
    if 'csv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'tsv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'txt' in url_dataset: 
        loader = "read_csv_auto"
    elif 'parquet' in url_dataset: 
        loader = "read_parquet"
    elif 'json' in url_dataset: 
        loader = "read_json_auto"
    elif 'xls' in url_dataset or 'xlsx' in url_dataset: 
        loader = "st_read"
    elif 'shp' in url_dataset: 
        loader = "st_read"
    elif 'geojson' in url_dataset: 
        loader = "st_read"
    elif 'xml' in url_dataset: 
        loader = "read_xml"
    elif 'html' in url_dataset: 
        loader = "read_html"
    else: 
        raise ValueError(f"Type de fichier non support√© pour {url_dataset}")
    
    if options=="": 
        options = "" 
    if 'csv' in url_dataset and safe_mode==True: 
        options = ", all_varchar=1" 
    if nom_table=="": 
        nom_table = "loaded_dataset"
    
    try:
        status = ddb.sql(f"""
            create or replace table {nom_table} as select *
            from
            {loader}("{url_dataset}" {options})
        """)
        return status
    except Exception as e:
        return f"Erreur au chargement du fichier : {str(e)}"

def run_query(sql):
    return ddb.sql(sql.replace("`"," ")).to_df()

# Chargement des donn√©es
load_file_from_url_lite("https://data.economie.gouv.fr/api/explore/v2.1/catalog/datasets/inventaire-immobilier-de-letat/exports/csv?use_labels=true", safe_mode=True)
print("‚úÖ Donn√©es charg√©es avec succ√®s")

## üîç Analyse SQL

Cette requ√™te utilise des techniques SQL pour extraire et transformer les donn√©es de mani√®re efficace.

In [2]:
# Ex√©cution de la requ√™te
df = run_query(""" SELECT 
  lpad("dept", 2, '0') AS code_dept,
  COUNT(*) AS nb_proprietes,
  COUNT(DISTINCT "id") AS nb_proprietes_uniques,
  COUNT(DISTINCT "ministere") AS nb_ministeres
FROM 
  loaded_dataset
GROUP BY 
  "dept"
ORDER BY 
  code_dept """)
print(f"R√©sultats : {len(df)} lignes")
df.head()

## üìà Visualisation

La biblioth√®que principale utilis√©e pour cette datavisualisation est Plotly Express, qui est id√©ale pour cr√©er des cartes interactives et des repr√©sentations graphiques complexes de mani√®re simple et efficace. Le choix d'une carte choropleth est pertinent pour repr√©senter des donn√©es g√©ographiques, telles que le nombre de propri√©t√©s de l'√âtat par d√©partement en France. Cela permet une visualisation claire et intuitive des donn√©es.

In [3]:
import pandas as pd
import duckdb as ddb
import plotly.express as px
import pandas as pd
import requests
import json

# R√©cup√©ration du geojson des d√©partements fran√ßais
url = "https://france-geojson.gregoiredavid.fr/repo/departements.geojson"
response = requests.get(url)
geojson = response.json()

# Mise en forme du code_dept en 2 chiffres
df['code_dept'] = df['code_dept'].astype(str).str.zfill(2)

# Cr√©ation de la carte choropleth
dataviz = px.choropleth_mapbox(
    df,
    geojson=geojson,
    locations='code_dept',
    featureidkey="properties.code",
    color='nb_proprietes',
    color_continuous_scale="Blues",
    range_color=[df['nb_proprietes'].min(), df['nb_proprietes'].max()],
    mapbox_style="carto-positron",
    zoom=4.5,
    center={"lat": 46.5, "lon": 2.5},
    opacity=0.7,
    labels={'nb_proprietes': "Nombre de propri√©t√©s"},
    hover_data={
        'code_dept': True,
        'nb_proprietes': True,
        'nb_proprietes_uniques': True,
        'nb_ministeres': True
    }
)

# Mise en page finale
dataviz.update_layout(
    margin=dict(l=0, r=0, t=50, b=0),
    title={
        'text': "Carte des propri√©t√©s de l'√âtat par d√©partement",
        'x': 0.5,
        'xanchor': 'center',
        'font': dict(size=16, family="Segoe UI")
    },
    coloraxis_colorbar_title_text="Nb propri√©t√©s",
    coloraxis_colorbar_len=0.8
)
dataviz

---
*Made with ‚ù§Ô∏è and with [duckit.fr](https://duckit.fr) - [Ali Hmaou](https://www.linkedin.com/in/ali-hmaou-6b7b73146/)*