# Cartographie Interactive des Lignes de M√©tro en √éle-de-France


Le jeu de donn√©es utilis√© pour cette analyse provient du site [data.iledefrance-mobilites.fr](https://data.iledefrance-mobilites.fr/api/explore/v2.1/catalog/datasets/traces-du-reseau-ferre-idf/exports/csv?lang=fr&timezone=Europe%2FBerlin&use_labels=true&delimiter=%3B), qui fournit les trac√©s du r√©seau ferr√© en √éle-de-France. Ce dataset contient des informations g√©olocalis√©es sur les lignes de train, de RER, de m√©tro et de tramway, y compris les exploitants, les dates de mise en service et d'autres d√©tails techniques.

L'objectif de cette analyse est de pr√©parer les donn√©es pour cr√©er une carte interactive des lignes de m√©tro en √éle-de-France, en incluant les couleurs web associ√©es √† chaque ligne. Cela permettra une visualisation claire et attrayante des lignes de m√©tro dans la r√©gion.


## M√©thodologie

La m√©thodologie utilis√©e pour cette analyse implique plusieurs √©tapes cl√©s. Tout d'abord, nous avons s√©lectionn√© les donn√©es pertinentes en utilisant une requ√™te SQL pour extraire les informations n√©cessaires sur les lignes de m√©tro. Ensuite, nous avons converti les g√©om√©tries des lignes en objets Shapely pour faciliter leur utilisation dans la cr√©ation de la carte interactive. Finalement, nous avons utilis√© la biblioth√®que Folium pour cr√©er la carte, en ajoutant les lignes de m√©tro avec leurs couleurs respectives et en incluant une l√©gende et un titre pour am√©liorer la lisibilit√© de la visualisation.


Nous avons utilis√© une requ√™te SQL pour s√©lectionner les donn√©es pertinentes, en nous concentrant sur les lignes de m√©tro et en extrayant les informations sur leur g√©om√©trie et leurs couleurs web. Les donn√©es ont ensuite √©t√© trait√©es et visualis√©es √† l'aide de biblioth√®ques Python telles que DuckDB, Pandas et Folium.

## üîß Configuration

In [1]:
# Installation et imports
import duckdb as ddb
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

## ü¶Ü Chargement du dataset avec Duckdb

In [1]:
# Fonction de chargement compl√®te (bas√©e sur load_file_from_url_lite)
def load_file_from_url_lite(url_dataset="", loader="read_csv_auto", options="", nom_table="loaded_dataset", safe_mode=False):
    ddb.execute("install spatial")
    ddb.execute("load spatial")
    ddb.execute("INSTALL h3 FROM community")
    ddb.execute("LOAD h3")
    ddb.execute("install webbed from community;")
    ddb.execute("load webbed")
    ddb.execute("set force_download=True")
    ddb.execute(f"drop table if exists {nom_table}")   
    
    # D√©tection automatique du type de fichier
    if 'csv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'tsv' in url_dataset: 
        loader = "read_csv_auto"
    elif 'txt' in url_dataset: 
        loader = "read_csv_auto"
    elif 'parquet' in url_dataset: 
        loader = "read_parquet"
    elif 'json' in url_dataset: 
        loader = "read_json_auto"
    elif 'xls' in url_dataset or 'xlsx' in url_dataset: 
        loader = "st_read"
    elif 'shp' in url_dataset: 
        loader = "st_read"
    elif 'geojson' in url_dataset: 
        loader = "st_read"
    elif 'xml' in url_dataset: 
        loader = "read_xml"
    elif 'html' in url_dataset: 
        loader = "read_html"
    else: 
        raise ValueError(f"Type de fichier non support√© pour {url_dataset}")
    
    if options=="": 
        options = "" 
    if 'csv' in url_dataset and safe_mode==True: 
        options = ", all_varchar=1" 
    if nom_table=="": 
        nom_table = "loaded_dataset"
    
    try:
        status = ddb.sql(f"""
            create or replace table {nom_table} as select *
            from
            {loader}("{url_dataset}" {options})
        """)
        return status
    except Exception as e:
        return f"Erreur au chargement du fichier : {str(e)}"

def run_query(sql):
    return ddb.sql(sql.replace("`"," ")).to_df()

# Chargement des donn√©es
load_file_from_url_lite("https://data.iledefrance-mobilites.fr/api/explore/v2.1/catalog/datasets/traces-du-reseau-ferre-idf/exports/csv?lang=fr&timezone=Europe%2FBerlin&use_labels=true&delimiter=%3B", safe_mode=True)
print("‚úÖ Donn√©es charg√©es avec succ√®s")

## üîç Analyse SQL

Cette requ√™te utilise des techniques SQL pour extraire et transformer les donn√©es de mani√®re efficace.

In [2]:
# Ex√©cution de la requ√™te
df = run_query(""" SELECT 
  ST_AsText(ST_GeomFromGeoJSON("Geo Shape")) AS geom_wkt,
  "mode",
  "ColourWeb_hexa" AS couleur_web
FROM 
  loaded_dataset
WHERE 
  "mode" = 'METRO' """)
print(f"R√©sultats : {len(df)} lignes")
df.head()

## üìà Visualisation

La biblioth√®que principale utilis√©e est Folium, qui est une surcouche Python pour Leaflet.js, permettant de cr√©er des cartes interactives. Folium est adapt√©e pour visualiser des donn√©es g√©ospatiales, comme les lignes de m√©tro, sur une carte interactive. Cela permet une repr√©sentation visuelle claire et dynamique des donn√©es.

In [3]:
import pandas as pd
import duckdb as ddb
import folium
from shapely import wkt
import pandas as pd

# Assurez-vous que df contient d√©j√† les colonnes geom_wkt, couleur_web et mode
# Conversion des g√©om√©tries WKT en objets Shapely
gdf = df.copy()
gdf['geometry'] = gdf['geom_wkt'].apply(wkt.loads)

# Cr√©ation de la carte centr√©e sur Paris
m = folium.Map(
    location=[48.8566, 2.3522],
    zoom_start=12,
    tiles='cartodbpositron',
    attr='¬© OpenStreetMap contributors ¬© CARTO'
)

group = folium.FeatureGroup(name='Lignes de m√©tro', overlay=True, control=True)

# Ajout des lignes color√©es
for _, row in gdf.iterrows():
    color = '#' + row['couleur_web'].lstrip('#')
    line = folium.PolyLine(
        locations=[[lat, lon] for lon, lat in wkt.loads(row['geom_wkt']).coords],
        color=color,
        weight=5,
        opacity=0.8,
        tooltip=f"Mode : {row['mode']}<br>Couleur : {color}"
    )
    line.add_to(group)
group.add_to(m)

# L√©gende HTML
legend_code = '''
<div style="
    position: fixed; 
    bottom: 20px; left: 20px; width: 220px; height: 50px; 
    background-color: white; z-index: 900; border:2px solid grey;
    padding: 8px;
    font-family: 'Roboto', sans-serif;
    font-size: 14px;
">
<b>L√©gende :</b><br>
Lignes de m√©tro<br>
(Modes et couleurs issues des donn√©es)
</div>
'''
m.get_root().html.add_child(folium.Element(legend_code))

# Titre HTML
title_code = '''
<div style="
    position: fixed; 
    top: 10px; left: 50%; transform: translateX(-50%);
    background-color: rgba(255,255,255,0.9); z-index: 900; border:2px solid grey;
    padding: 8px 16px;
    font-family: 'Roboto', sans-serif;
    font-size: 18px;
    font-weight: bold;
">
Carte interactive des lignes de m√©tro d'√éle-de-France
</div>
'''
m.get_root().html.add_child(folium.Element(title_code))

folium.LayerControl(collapsed=False).add_to(m)

# Variable globale pour publication
dataviz = m
dataviz

---
*Made with ‚ù§Ô∏è and with [duckit.fr](https://duckit.fr) - [Ali Hmaou](https://www.linkedin.com/in/ali-hmaou-6b7b73146/)*