# üöå Projet MDM - Mobilit√© Durable en Montagne ‚õ∞Ô∏è

*Auteur : Thibault Launois*

*Date : 26/10/2025*

**Description :**

Ce script charge les donn√©es de **List_iti_D4G_isere_output_altitude.csv** g√©n√©r√© par **2025-10-20_TLaunois_C2C_altitude.ipynb** et va cr√©er un geoparquet.
Les points de d√©part pour chaque topo n'√©tant pas fourni par C2C, on d√©finit le point de d√©part comme √©tant le point d'un topo ayant l'altitude la plus basse.

# Importation des modules

In [None]:
import geopandas as gpd
import pandas as pd

# Charger les donn√©es

In [None]:
df = pd.read_csv("../data/C2C/Liste_iti_D4G_isere_output_altitude.csv", index_col=0)
df.head(2)

Unnamed: 0,Titre itin√©raire,Id itin√©raire,url,activit√©,dur√©e,d√©nivel√© (m),longueur (m),R√©gion/massif,Id wp principal,"(id WP - titre - [X,Y] - accessibilit√© (si renseign√©) )",X,Y,lon,lat,altitude
0,Les Bans:Spigolo Sud du Contrefort M√©dian. Voi...,1780070,https://www.camptocamp.org/routes/1780070,mountain_climbing,['1'],,0.0,(14328 - Is√®re)(14403 - √âcrins),39056.0,"(39056 - Les Bans - [705350.3499286951, 55976...",705350.349929,5597690.0,6.33627,44.84842,3564.832275
1,Les Bans:Spigolo Sud du Contrefort M√©dian. Voi...,1780070,https://www.camptocamp.org/routes/1780070,mountain_climbing,['1'],,0.0,(14328 - Is√®re)(14403 - √âcrins),39056.0,(127458 - Entre Les Aygues - [712692.092985492...,712692.092985,5594929.0,6.402222,44.830833,1613.258789


# D√©terminer le point de d√©part pour chaque topo

On fait l'hypoth√®se que le point de d√©part d'un topo est le point ayant l'altitude la plus basse.\
La colonne "Id Itin√©raire" permet de compter le nombre de topo dans la base de donn√©e, attention diff√©rents topos peuvent avoir le m√™me nom.

In [None]:
# je cr√©e le dataframe avec le point de d√©part pour chaque topo
data = []

for id in df["Id itin√©raire"].unique():
    data.append(list(df[df["Id itin√©raire"] == id].sort_values("altitude").iloc[0]))

# aws = access way point
df_awp = pd.DataFrame(data=data, columns=df.columns)

# Rajout d'une colonne avec l'id du point du d√©part
Dans la colonne **(id WP - titre - [X,Y] - accessibilit√© (si renseign√©) )**, on a les informations du point de d√©part.

In [87]:
dict_data = dict()
data2 = []

for index, row in df_awp.iterrows():
    # id du point de d√©part
    id_wp = int(
        row["(id WP - titre - [X,Y] - accessibilit√© (si renseign√©) )"]
        .strip("()")
        .split(" - ")[0]
    )
    data2.append(id_wp)

    # enregistre
    if id_wp not in dict_data:
        name = (
            row["(id WP - titre - [X,Y] - accessibilit√© (si renseign√©) )"]
            .strip("()")
            .split(" - ")[1]
        )
        dict_data[id_wp] = [name, row["lon"], row["lat"]]

df_awp["Id wp"] = data2

In [None]:
# on regroupe et compte le nombre de topo par point de d√©part
df_awp2 = df_awp.groupby("Id wp").nunique()["Id itin√©raire"]

In [89]:
data_name = []
data_lat = []
data_lon = []
data_nbr_topo = []

for index in df_awp2.index:
    data_name.append(dict_data[index][0])
    data_lon.append(dict_data[index][1])
    data_lat.append(dict_data[index][2])
    data_nbr_topo.append(df_awp2[index])

In [None]:
df_awp2 = pd.DataFrame(
    {
        "Id wp": df_awp2.index,
        "Name wp": data_name,
        "lat": data_lat,
        "lon": data_lon,
        "nbr_topo": data_nbr_topo,
    }
)

In [None]:
# df_awp2.to_csv("../data/C2C/Liste_point_depart_isere.csv", index = False)

# Cr√©ation du geo-parquet
Il faut renommer les colonnes afin de coller au format pour le g√©oparquet

In [None]:
# Je renomme les colonnes existantes avec le bon nom
df_geoparquet = df_awp2.rename(
    columns={"Name wp": "name", "Id wp": "navitia_id", "nbr_topo": "other"}
)


# je mets l'info du nombre de topos au bon format
def to_dict(x):
    return {"nombre_de_depart_de_topo": x}


df_geoparquet["other"] = df_geoparquet["other"].map(to_dict)

In [None]:
# je cr√©e les colonnes inexistantes et je les rempli de vide
df_geoparquet["gtfs_id"] = ""
df_geoparquet["osm_id"] = ""
df_geoparquet["description"] = ""
df_geoparquet["line_gtfs_ids"] = ""
df_geoparquet["line_osm_ids"] = ""
df_geoparquet["geometry"] = ""

In [None]:
# je transforme la colonne latitude et longitude en points (lat,lon) en cr√©ant le geo-dataframe
gdf = gpd.GeoDataFrame(
    df_geoparquet,
    geometry=gpd.points_from_xy(df_geoparquet.lon, df_geoparquet.lat, crs="EPSG:4326"),
)

In [None]:
# Je r√©ordonne les colonnes dans le bon ordre
gdf = gdf[
    [
        "gtfs_id",
        "navitia_id",
        "osm_id",
        "name",
        "description",
        "line_gtfs_ids",
        "line_osm_ids",
        "geometry",
        "other",
    ]
]

In [None]:
# je sauvegarde au format dataframe
gdf.to_parquet("../data/C2C/depart_topos_stops_isere.parquet", index=False)