# Cartographie des Mus√©es de Paris : Une Exploration G√©ographique et Culturelle

La pr√©sente analyse se concentre sur la cr√©ation d'une carte interactive des mus√©es de Paris en utilisant un jeu de donn√©es provenant du site data.culture.gouv.fr. Le jeu de donn√©es utilis√© est disponible √† l'adresse https://data.culture.gouv.fr/api/explore/v2.1/catalog/datasets/liste-et-localisation-des-musees-de-france/exports/parquet?lang=fr&timezone=Europe%2FBerlin et contient des informations d√©taill√©es sur les mus√©es de France, notamment leur localisation, coordonn√©es g√©ographiques, identifiants, et autres d√©tails administratifs. L'objectif principal est d'adapter ces donn√©es pour mettre en avant les mus√©es situ√©s dans la ville de Paris.


L'analyse vise √† fournir une visualisation interactive qui permet aux utilisateurs d'explorer la r√©partition g√©ographique des mus√©es √† Paris. Cela contribuera √† une meilleure compr√©hension de l'offre culturelle dans la capitale fran√ßaise et pourra √™tre utile pour les touristes, les chercheurs et les d√©cideurs. La visualisation finale sera une carte interactive qui affiche les mus√©es avec des marqueurs personnalis√©s, offrant des informations d√©taill√©es au survol ou au clic.


## M√©thodologie

La m√©thodologie employ√©e pour cette analyse comporte plusieurs √©tapes cl√©s. Tout d'abord, les donn√©es sources sont import√©es et filtr√©es pour ne conserver que les entr√©es relatives √† la commune de Paris. Une requ√™te SQL sp√©cifique est utilis√©e pour extraire les informations n√©cessaires, notamment le nom officiel du mus√©e, les coordonn√©es g√©ographiques (latitude et longitude), ainsi que la g√©olocalisation au format WKT. Les donn√©es r√©sultantes sont ensuite utilis√©es pour cr√©er une carte interactive avec la biblioth√®que Folium, o√π chaque mus√©e est repr√©sent√© par un marqueur personnalis√© avec une infobulle contenant des informations sur le mus√©e. La carte est configur√©e pour offrir une exp√©rience utilisateur fluide et informative, avec des fonctionnalit√©s telles que le zoom et le plein √©cran.

## üîß Configuration

In [1]:
# Installation et imports
import duckdb as ddb
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

## ü¶Ü Chargement du dataset avec Duckdb

In [2]:
# Fonction de chargement compl√®te (bas√©e sur load_file_from_url_lite)
def load_file_from_url_lite(url_dataset="", loader="read_csv_auto", options="", nom_table="loaded_dataset", safe_mode=False):
    ddb.execute("install spatial")
    ddb.execute("load spatial")
    ddb.execute("INSTALL h3 FROM community")
    ddb.execute("LOAD h3")
    ddb.execute("install webbed from community;")
    ddb.execute("load webbed")
    ddb.execute("set force_download=True")
    ddb.execute(f"drop table if exists {nom_table}")   
    
    # D√©tection automatique du type de fichier
    if 'csv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'tsv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'txt' in url_dataset: 
        loader = "read_csv_auto"
    elif 'parquet' in url_dataset: 
        loader = "read_parquet"
    elif 'json' in url_dataset: 
        loader = "read_json_auto"
    elif 'xls' in url_dataset or 'xlsx' in url_dataset: 
        loader = "st_read"
    elif 'shp' in url_dataset: 
        loader = "st_read"
    elif 'geojson' in url_dataset: 
        loader = "st_read"
    elif 'xml' in url_dataset: 
        loader = "read_xml"
    elif 'html' in url_dataset: 
        loader = "read_html"
    else: 
        raise ValueError(f"Type de fichier non support√© pour {url_dataset}")
    
    if options=="": 
        options = "" 
    if 'csv' in url_dataset and safe_mode==True: 
        options = ", all_varchar=1" 
    if nom_table=="": 
        nom_table = "loaded_dataset"
    
    try:
        status = ddb.sql(f"""
            create or replace table {nom_table} as select *
            from
            {loader}("{url_dataset}" {options})
        """)
        return status
    except Exception as e:
        return f"Erreur au chargement du fichier : {str(e)}"

def run_query(sql):
    return ddb.sql(sql.replace("`"," ")).to_df()

# Chargement des donn√©es
load_file_from_url_lite("https://data.culture.gouv.fr/api/explore/v2.1/catalog/datasets/liste-et-localisation-des-musees-de-france/exports/parquet?lang=fr&timezone=Europe%2FBerlin", safe_mode=True)
print("‚úÖ Donn√©es charg√©es avec succ√®s")

‚úÖ Donn√©es charg√©es avec succ√®s


## üîç Analyse SQL

Cette requ√™te utilise des techniques SQL pour extraire et transformer les donn√©es de mani√®re efficace.

In [3]:
# Ex√©cution de la requ√™te
df = run_query(""" SELECT 
  "nom_officiel_du_musee" AS nom_musee,
  "latitude" AS lat,
  "longitude" AS lon,
  ST_AsText("geolocalisation") AS geom_wkt
FROM 
  loaded_dataset
WHERE 
  "commune" = 'Paris'
ORDER BY 
  "nom_officiel_du_musee" """)
print(f"R√©sultats : {len(df)} lignes")
df.head()

R√©sultats : 50 lignes


Unnamed: 0,nom_musee,lat,lon,geom_wkt
0,"Palais Galliera, mus√©e de la mode et de la vil...",48.866137,2.297248,POINT (2.297248499625773 48.866136805463356)
1,"Petit Palais, mus√©e des beaux-arts de la ville...",48.86609,2.313763,POINT (2.313763 48.86609)
2,maison de Balzac,48.855398,2.280805,POINT (2.280805 48.855398)
3,maison de Victor Hugo,48.854808,2.366232,POINT (2.366232 48.854808)
4,mus√©e Bourdelle,48.843017,2.31883,POINT (2.31883 48.843017)


## üìà Visualisation

La biblioth√®que principale utilis√©e est Folium, qui permet de cr√©er des cartes interactives avec des marqueurs personnalis√©s. Ce choix est adapt√© pour visualiser des donn√©es g√©olocalis√©es comme les mus√©es √† Paris, car il offre une repr√©sentation visuelle claire et interactive. Folium permet √©galement de personnaliser l'apparence de la carte et des marqueurs pour une exp√©rience utilisateur am√©lior√©e.

In [4]:
import pandas as pd
import duckdb as ddb
import folium
from folium.plugins import Fullscreen
import branca.colormap as cm

# Palette de couleurs mus√©e (tons ocre/beige/caf√©)
palette = ["#8B4513", "#A0522D", "#CD853F", "#DEB887", "#F5DEB3", "#FFE4B5"]

# Cr√©er la carte centr√©e sur Paris avec un th√®me sobre
carte = folium.Map(
    location=[48.8567, 2.3508],
    zoom_start=12,
    tiles='CartoDB.Positron',
    attr='¬© OpenStreetMap contributors ¬© CARTO'
)

# Ajouter des marqueurs avec ic√¥ne personnalis√©e
museum_icon = folium.Icon(
    color='darkgreen',
    icon='building-columns',
    prefix='fa'
)

# Ajouter les marqueurs avec popup riche
for _, row in df.iterrows():
    popup_html = f"""
    <div style="font-family: Georgia, serif; font-size: 12px; max-width: 250px;">
        <h4 style="color: #8B4513; margin: 0 0 5px 0;">{row['nom_musee']}</h4>
        <p style="margin: 2px 0;"><b>Latitude:</b> {row['lat']:.4f}</p>
        <p style="margin: 2px 0;"><b>Longitude:</b> {row['lon']:.4f}</p>
    </div>
    """
    
    folium.Marker(
        location=[row['lat'], row['lon']],
        popup=folium.Popup(popup_html, max_width=300),
        icon=museum_icon
    ).add_to(carte)

# Ajouter le bouton plein √©cran
Fullscreen(position='topright').add_to(carte)

# Ajouter un cadre d√©coratif autour
css = """
<style>
    .folium-map {
        border: 3px solid #8B4513;
        border-radius: 10px;
        box-shadow: 0 4px 8px rgba(0,0,0,0.2);
    }
</style>
"""
carte.get_root().header.add_child(folium.Element(css))

# Enregistrer la carte
carte.save('carte_musees_paris_ambiance.html')

dataviz = carte
dataviz

---
*Made with ‚ù§Ô∏è and with [duckit.fr](https://duckit.fr) - [Ali Hmaou](https://www.linkedin.com/in/ali-hmaou-6b7b73146/)*

In [5]:

# --- Variables inject√©es par le script ---
FINAL_OBJECT_VARIABLE_NAME = 'dataviz'
OUTPUT_IMAGE_NAME = 'published\\notebooks\\duckit_analysis_20250806_065635.png'
OUTPUT_HTML_NAME = 'published\\notebooks\\duckit_analysis_20250806_065635.html'

# ===================================================================
# CELLULE INJECT√âE AUTOMATIQUEMENT (VERSION ROBUSTE)
# ===================================================================
import sys
import os
# On importe les modules n√©cessaires pour l'export au cas o√π
try:
    from bokeh.io import save as bokeh_save
except ImportError:
    bokeh_save = None

try:
    # On s'assure que le dossier de sortie existe
    output_dir = os.path.dirname(OUTPUT_IMAGE_NAME)
    if output_dir:
        os.makedirs(output_dir, exist_ok=True)

    # On utilise globals().get() pour une r√©cup√©ration plus s√ªre
    final_object = globals().get(FINAL_OBJECT_VARIABLE_NAME)

    if final_object is None:
        # On l√®ve une NameError pour √™tre coh√©rent avec le code original
        raise NameError(f"name '{FINAL_OBJECT_VARIABLE_NAME}' is not defined")

    print(f"INFO: Variable '{FINAL_OBJECT_VARIABLE_NAME}' trouv√©e. Tentative d'exportation...")

    object_type = str(type(final_object))

    if 'plotly.graph_objs._figure.Figure' in object_type:
        print(f"--> D√©tect√© : Plotly. Sauvegarde HTML et PNG.")
        # 1. Sauvegarde HTML pour l'interactivit√©
        print(f"--> Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.write_html(OUTPUT_HTML_NAME, include_plotlyjs='cdn')
        # 2. Sauvegarde PNG pour l'aper√ßu statique
        try:
            print(f"--> Tentative de sauvegarde PNG directe dans : {OUTPUT_IMAGE_NAME}")
            final_object.write_image(OUTPUT_IMAGE_NAME, scale=3, width=1200, height=800)
            print(f"--> Image Plotly sauvegard√©e avec succ√®s.")
        except Exception as e:
            print(f"AVERTISSEMENT: La sauvegarde directe en PNG a √©chou√© (kaleido est-il install√©?).", file=sys.stderr)
            print(f"   Erreur: {e}", file=sys.stderr)
            print(f"--> PLAN B: On va utiliser la capture d'√©cran du HTML √† la place.")
            # On cr√©e un fichier marqueur pour que le script de post-traitement prenne le relais
            with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
                f.write("plotly")
    elif 'folium.folium.Map' in object_type:
        print(f"--> D√©tect√© : Folium. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.save(OUTPUT_HTML_NAME)
        # On cr√©e un fichier marqueur g√©n√©rique pour la capture d'√©cran
        print(f"--> Cr√©ation du marqueur de capture d'√©cran.")
        with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
            f.write("folium")
    elif 'altair.vegalite' in object_type and hasattr(final_object, 'save'):
        print(f"--> D√©tect√© : Altair. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        final_object.save(OUTPUT_HTML_NAME)
        # On cr√©e un fichier marqueur g√©n√©rique pour la capture d'√©cran
        print(f"--> Cr√©ation du marqueur de capture d'√©cran.")
        with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
            f.write("altair")
    elif 'bokeh.plotting' in object_type and bokeh_save is not None:
        print(f"--> D√©tect√© : Bokeh. Sauvegarde HTML dans : {OUTPUT_HTML_NAME}")
        bokeh_save(final_object, filename=OUTPUT_HTML_NAME, title="")
        # On cr√©e un fichier marqueur g√©n√©rique pour la capture d'√©cran
        print(f"--> Cr√©ation du marqueur de capture d'√©cran.")
        with open(f"{OUTPUT_HTML_NAME}.needs_screenshot", "w") as f:
            f.write("bokeh")
    elif 'matplotlib.figure.Figure' in object_type:
        print(f"--> D√©tect√© : Matplotlib. Sauvegarde dans : {OUTPUT_IMAGE_NAME}")
        final_object.savefig(OUTPUT_IMAGE_NAME, dpi=300, bbox_inches='tight')
    else:
        print(f"AVERTISSEMENT: Type non support√© : {object_type}", file=sys.stderr)
except NameError:
    print(f"AVERTISSEMENT: Aucune variable '{FINAL_OBJECT_VARIABLE_NAME}' trouv√©e.", file=sys.stderr)
except Exception as e:
    print(f"ERREUR lors de l'exportation : {e}", file=sys.stderr)


INFO: Variable 'dataviz' trouv√©e. Tentative d'exportation...
--> D√©tect√© : Folium. Sauvegarde HTML dans : published\notebooks\duckit_analysis_20250806_065635.html
--> Cr√©ation du marqueur de capture d'√©cran.
