In [1]:
import pandas as pd

# 1) Charger la table agrégée existante
fact = pd.read_csv("dept_specialite_long.csv")

# 2) Harmoniser les codes
fact["dept_code"] = fact["dept_code"].astype(str).str.zfill(2)

# 3) Construire la table de faits dataviz-ready
fact["geo_niveau"] = "DEPARTEMENT"
fact = fact.rename(columns={
    "dept_code": "geo_code"
    # "specialite": déjà OK
    # "charge_pathologique": déjà OK
})

# Option : réordonner les colonnes pour plus de lisibilité
fact = fact[["geo_niveau", "geo_code", "specialite", "charge_pathologique"]]

# 4) Export
fact.to_csv("fact_dep_specialite_patho.csv", index=False)

print(fact.head())
print("✅ Fichier généré : fact_dep_specialite_patho.csv")


    geo_niveau geo_code                 specialite  charge_pathologique
0  DEPARTEMENT       01                      Autre             878452.0
1  DEPARTEMENT       01               Dermatologie                220.0
2  DEPARTEMENT       01  Hépato-gastro-entérologie                 35.0
3  DEPARTEMENT       01              Infectiologie               6696.0
4  DEPARTEMENT       01                  Oncologie              37446.0
✅ Fichier généré : fact_dep_specialite_patho.csv


In [None]:
import os
import geopandas as gpd

gpkg_path = os.path.join("data", "ADE_4-0_GPKG_WGS84G_FRA-ED2025-10-15.gpkg")
dept_layer = "departement"  # déjà identifié

gdf_dep = gpd.read_file(gpkg_path, layer=dept_layer)

# Création du dept_code compatible
gdf_dep["dept_code"] = gdf_dep["code_insee"].astype(str).str.zfill(2)

# Construire la dimension géo (sans geometry)
dim_dep = (
    gdf_dep[["dept_code", "nom_officiel", "code_insee_de_la_region", "code_siren"]]
    .drop_duplicates()
    .rename(columns={
        "dept_code": "geo_code",
        "nom_officiel": "geo_libelle",
        "code_insee_de_la_region": "code_region",
        "code_siren": "code_siren_dep"
    })
)

dim_dep["geo_niveau"] = "DEPARTEMENT"

# Réordonner pour la lisibilité
dim_dep = dim_dep[["geo_niveau", "geo_code", "geo_libelle", "code_region", "code_siren_dep"]]

dim_dep.to_csv("dim_geo_departement.csv", index=False)

print(dim_dep.head())
print("✅ Fichier généré : dim_geo_departement.csv")


    geo_niveau geo_code        geo_libelle code_region code_siren_dep
0  DEPARTEMENT       07            Ardèche          84      220700017
1  DEPARTEMENT       63        Puy-de-Dôme          84      226300010
2  DEPARTEMENT       76     Seine-Maritime          28      227605409
3  DEPARTEMENT       17  Charente-Maritime          75      221700016
4  DEPARTEMENT       75              Paris          11      227500055
✅ Fichier généré : dim_geo_departement.csv
