🚌 Projet MDM - Mobilité Durable en Montagne ⛰️

*Author : Laurent Sorba*

*Date : 04/07/2025*

**Description :**

This Jupyter Notebook analyses the accessibility of the itineraries by measuring proximity to public transport stops, using pandas/geopandas to parse waypoints from the C2C CSV export for Isère `List_iti_D4G_isre.csv` and extract bus stop locations from a PostgreSQL SQL C2C dump  `UTF-8dump-c2corg-202505050900.sql.zip`. It performs spatial analysis to count itineraries within 0.5km–5km zones around bus stops using the EPSG:3857 coordinate system.

## Définition des fonctions

In [1]:
import io
import json
import zipfile
from pathlib import Path

import geopandas as gpd
import pandas as pd
import requests
from shapely.geometry import Point


# 1. Télécharger et extraire les données GTFS
def download_gtfs_data(gtfs_url):
    """Télécharge et extrait les données GTFS"""
    print(f"=== Télécharge les données GTFS depuis {gtfs_url} ===")
    response = requests.get(gtfs_url)
    with zipfile.ZipFile(io.BytesIO(response.content)) as zip_file:
        # Extraire les fichiers nécessaires
        stops_df = pd.read_csv(zip_file.open("stops.txt"))
        print(f"Chargé {len(stops_df)} arrêts")
        routes_df = pd.read_csv(zip_file.open("routes.txt"))
        print(f"Chargé {len(routes_df)} lignes")

        # Autres fichiers GTFS si nécessaire
        try:
            stop_times_df = pd.read_csv(zip_file.open("stop_times.txt"))
            print(f"(Chargé {len(routes_df)} stop_times)")
            trips_df = pd.read_csv(zip_file.open("trips.txt"))
            print(f"(Chargé {len(routes_df)} trips)")
        except KeyError:
            stop_times_df = None
            trips_df = None

    return stops_df, routes_df, stop_times_df, trips_df


# 2. Filtrer les arrêts par département de l'Isère par défaut
def filter_stops_by_department(stops_df, department_code="38"):
    """Filtre les arrêts par code département"""
    return filter_with_administrative_boundaries(stops_df, department_code)


# 3. Filtrer les lignes de transport correspondant
def filter_routes_by_stops(routes_df, filtered_stops, trips_df=None, stop_times_df=None):
    """Filtre les lignes qui desservent les arrêts filtrés"""
    if trips_df is not None and stop_times_df is not None:
        # Trouver les trips qui passent par les arrêts filtrés
        department_stop_ids = filtered_stops["stop_id"].unique()
        trips_with_department_stops = stop_times_df[
            stop_times_df["stop_id"].isin(department_stop_ids)
        ]["trip_id"].unique()

        # Trouver les routes correspondantes
        routes_in_department = trips_df[trips_df["trip_id"].isin(trips_with_department_stops)][
            "route_id"
        ].unique()

        filtered_routes = routes_df[routes_df["route_id"].isin(routes_in_department)]
    else:
        # Si pas de données de correspondance, retourner toutes les routes
        filtered_routes = routes_df

    return filtered_routes


def filter_with_administrative_boundaries(stops_df, department_code):
    """
    Filtre les arrêts de transport en utilisant les limites administratives précises
    du département de l'Isère
    """

    # 1. Charger les limites administratives du département
    department_boundary = download_department_boundary(department_code)

    if department_boundary is None:
        print(
            "Impossible de télécharger les limites administratives. Utilisation du filtrage par coordonnées."
        )
        exit

    # 2. Convertir les arrêts en GeoDataFrame
    stops_gdf = create_stops_geodataframe(stops_df)

    # 3. Filtrer les arrêts qui se trouvent dans le département
    filtered_stops = spatial_filter_stops(stops_gdf, department_boundary)

    return filtered_stops


def download_department_boundary(department_code="38"):
    """
    Charge ou télécharge les limites administratives du département de l'Isère
    """

    # Utiliser les données de data.gouv.fr
    try:
        boundary = load_department_geometry(department_code)
        if boundary is not None:
            return boundary
    except Exception as e:
        print(f"Erreur avec data.gouv.fr: {e}")

    # Fallback : Utiliser des coordonnées prédéfinies
    try:
        boundary = create_isere_boundary_from_coords()
        return boundary
    except Exception as e:
        print(f"Erreur avec coordonnées prédéfinies: {e}")

    return None


def download_from_data_gouv(file_path):
    """
    Télécharge depuis data.gouv.fr - Contours des départements français
    """
    # URL des contours des départements français
    url = "https://www.data.gouv.fr/fr/datasets/r/90b9341a-e1f7-4d75-a73c-bbc010c7feeb"
    print(f"=== Télécharge les contours des départements français {url} ===")
    try:
        # Télécharger le GeoJSON
        response = requests.get(url, timeout=30)
        response.raise_for_status()

        # Récupérer le contenu JSON
        geojson_data = response.json()

        # Créer le répertoire s'il n'existe pas
        file_path = Path(file_path)
        file_path.parent.mkdir(parents=True, exist_ok=True)

        # Sauvegarder dans le fichier
        with open(file_path, "w", encoding="utf-8") as f:
            json.dump(geojson_data, f, ensure_ascii=False, indent=2)

        print(f"Fichier sauvegardé avec succès : {file_path}")
        print(f"Nombre de départements : {len(geojson_data['features'])}")

    except Exception as e:
        print(f"Erreur lors du téléchargement depuis data.gouv.fr: {e}")
        return None


def load_department_geometry(department_code="38"):
    """
    Télécharge depuis data.gouv.fr - Contours des départements français
    """
    # URL des contours des départements français
    file = "../data/transportdatagouv/contour-des-departements.geojson"
    print(f"=== Charge les contours des départements français depuis le fichier {file} ===")

    try:
        # Test if file exists
        if not Path(file).is_file():
            print(f"-> Le fichier n'existe pas, téléchargement nécessaire.")
            download_from_data_gouv(file)

        # Charger le GeoJSON
        france_departments = gpd.read_file(file)

        # Filtrer sur un département
        department_boundary = france_departments[france_departments["code"] == department_code]

        if not department_boundary.empty:
            return department_boundary.iloc[0].geometry
        else:
            print(f"Département {department_code} non trouvé dans les données")
            return None

    except Exception as e:
        print(f"Erreur lors du chargement des contours des départements: {e}")
        return None


def create_isere_boundary_from_coords():
    """
    Crée une approximation des limites de l'Isère à partir de coordonnées connues
    """
    from shapely.geometry import Polygon

    print(f"=== Fallback: Utiliser des coordonnées prédéfinies de l'Isère ===")

    # Coordonnées approximatives des limites de l'Isère
    isere_coords = [
        (5.2, 44.8),  # Sud-Ouest
        (6.3, 44.8),  # Sud-Est
        (6.3, 45.9),  # Nord-Est
        (5.2, 45.9),  # Nord-Ouest
        (5.2, 44.8),  # Fermeture du polygone
    ]

    boundary = Polygon(isere_coords)
    return boundary


def create_stops_geodataframe(stops_df):
    """
    Convertit le DataFrame des arrêts en GeoDataFrame
    """
    # Créer des objets Point à partir des coordonnées
    geometry = [Point(xy) for xy in zip(stops_df["stop_lon"], stops_df["stop_lat"])]

    # Créer le GeoDataFrame
    stops_gdf = gpd.GeoDataFrame(
        stops_df,
        geometry=geometry,
        crs="EPSG:4326",  # WGS84
    )

    return stops_gdf


def spatial_filter_stops(stops_gdf, department_boundary):
    """
    Filtre spatialement les arrêts qui se trouvent dans les limites du département
    """
    print(
        f"=== Filtre spatialement les arrêts qui se trouvent dans les limites du département ==="
    )
    # Créer un GeoDataFrame pour la limite du département
    if hasattr(department_boundary, "crs"):
        boundary_gdf = gpd.GeoDataFrame(
            [1], geometry=[department_boundary], crs=department_boundary.crs
        )
    else:
        boundary_gdf = gpd.GeoDataFrame([1], geometry=[department_boundary], crs="EPSG:4326")

    # S'assurer que les deux GeoDataFrames ont le même CRS
    if stops_gdf.crs != boundary_gdf.crs:
        stops_gdf = stops_gdf.to_crs(boundary_gdf.crs)

    # Filtrage spatial : garder les arrêts qui intersectent avec la limite
    filtered_stops = gpd.sjoin(stops_gdf, boundary_gdf, how="inner", predicate="within")

    # Supprimer les colonnes ajoutées par sjoin
    filtered_stops = filtered_stops.drop(columns=["index_right"], errors="ignore")

    return filtered_stops

## Définition des variables

In [10]:
pd.set_option("display.max_columns", None)

# URLs des données GTFS contenant l'Isère
gtfs_sources = {
    # Definition https://transport.data.gouv.fr/datasets/agregat-oura
    "agregat-oura": "https://api.oura3.cityway.fr/dataflow/offre-tc/download?provider=OURA&dataFormat=GTFS&dataProfil=OPENDATA",
    # Definition https://transport.data.gouv.fr/datasets/reseau-cars-region-isere-38
    "reseau-cars-region-isere-38": "https://www.itinisere.fr/fr/donnees-open-data/169/OpenData/Download?fileName=CG38.GTFS.zip",
    # Definition https://transport.data.gouv.fr/datasets/horaires-theoriques-du-reseau-tag
    "TAG_Grenoble": "https://data.mobilites-m.fr/api/gtfs/SEM",
}

department_code = "38"
data_set = "agregat-oura"
gtfs_url = gtfs_sources[data_set]

In [3]:
print(f"=== Filtrage avec limites administratives du '{department_code}' sur '{data_set}' ===")

=== Filtrage avec limites administratives du '38' sur 'agregat-oura' ===


### Télécharger les données GTFS

In [4]:
stops_df, routes_df, stop_times_df, trips_df = download_gtfs_data(gtfs_url)

=== Télécharge les données GTFS depuis https://api.oura3.cityway.fr/dataflow/offre-tc/download?provider=OURA&dataFormat=GTFS&dataProfil=OPENDATA ===
Chargé 24075 arrêts
Chargé 1456 lignes
(Chargé 1456 stop_times)
(Chargé 1456 trips)


  stop_times_df = pd.read_csv(zip_file.open('stop_times.txt'))


### Filtrer les arrêts

In [12]:
filtered_stops = filter_stops_by_department(stops_df, department_code)
print(
    f"Nombre d'arrêts dans le {department_code}: {len(filtered_stops)} sur un total de {len(stops_df)}"
)

=== Charge les contours des départements français depuis le fichier ../data/transportdatagouv/contour-des-departements.geojson ===
=== Filtre spatialement les arrêts qui se trouvent dans les limites du département ===
Nombre d'arrêts dans le 38: 7914 sur un total de 24075


### Filtrer les lignes

In [13]:
filtered_routes = filter_routes_by_stops(routes_df, filtered_stops, trips_df, stop_times_df)
print(
    f"Nombre de lignes dans le {department_code}: {len(filtered_routes)} sur un total de {len(routes_df)}"
)

Nombre de lignes dans le 38: 532 sur un total de 1456


## Résultats

In [14]:
# Exemples d'arrêts
print("\nPremiers arrêts filtrés:")
print(filtered_stops[["stop_id", "stop_code", "stop_name", "stop_lat", "stop_lon"]].head(10))


Premiers arrêts filtrés:
                     stop_id stop_code               stop_name   stop_lat  \
7209  FR:38001:ZE:3757:ISERE     16846            LA CHARRIERE  45.496367   
7210  FR:38001:ZE:3758:ISERE     16847            LA CHARRIERE  45.496276   
7211  FR:38001:ZE:3759:ISERE     16856             LES ETRAITS  45.502212   
7212  FR:38001:ZE:3760:ISERE     16857             LES ETRAITS  45.502328   
7213  FR:38001:ZE:3761:ISERE     16862              BEGENSIERE  45.500805   
7214  FR:38001:ZE:3762:ISERE     16863              BEGENSIERE  45.501233   
7215  FR:38001:ZE:4230:ISERE     17550                LA POSTE  45.537368   
7216  FR:38001:ZE:4231:ISERE     17551                LA POSTE  45.537257   
7217  FR:38001:ZE:4232:ISERE     17552  COLLEGE MARCEL BOUVIER  45.536197   
7218  FR:38001:ZE:4233:ISERE     17553  COLLEGE MARCEL BOUVIER  45.536055   

      stop_lon  
7209  5.609307  
7210  5.609524  
7211  5.593296  
7212  5.593205  
7213  5.606018  
7214  5.606007  
7215  5

In [11]:
# Exemples de lignes
print("\nPremières lignes filtrées:")
print(filtered_routes[["route_id", "route_short_name", "route_long_name"]].head(10))


Premières lignes filtrées:
                             route_id route_short_name  \
110          ARDECHE:Line:1000575:LOC              E04   
134          ARDECHE:Line:1000601:LOC              E95   
213       BOURGOINxJALLIEU:Line:1:LOC                1   
214  BOURGOINxJALLIEU:Line:1021x2:LOC             1021   
215  BOURGOINxJALLIEU:Line:1131x2:LOC             1131   
216  BOURGOINxJALLIEU:Line:1141x2:LOC             1141   
217  BOURGOINxJALLIEU:Line:1390x2:LOC             1390   
218       BOURGOINxJALLIEU:Line:2:LOC                2   
219  BOURGOINxJALLIEU:Line:2091x2:LOC             2091   
220       BOURGOINxJALLIEU:Line:3:LOC                3   

                     route_long_name  
110  Annonay - St Rambert - le Péage  
134  Annonay - St Rambert - Le Péage  
213                                1  
214                             1021  
215                             1131  
216                             1141  
217                             1390  
218                  