# 🗺️ Atelier Analyse de données géographiques

<a href="https://www.linkedin.com/company/data-for-good-grenoble/" target="_blank"><img src="https://github.com/data-for-good-grenoble/atelier-donnees-geographiques/blob/main/notebooks/D4G_logo.png?raw=1" width=200px/></a>

## 🗓️ Jeudi 15 mai 2024 - 18h45 - <a href="https://turbine.coop" target="_blank">La Turbine</a>

### PARTIE N°1 :

Pour commencer cet atelier, nous explorerons les packages d'analyse de données géographiques tels que Geopandas, Shapely ou Plotly sur des données en open data. Nous montrerons aussi comment télécharger des données d'OpenStreetMap 🗺️

### PARTIE N°2 :     

Nous ferons des mises en application sur des données de transports en commun et de sentiers de randonnée en Isère, pour lancer au passage notre prochain projet sur l'accessibilité des randos en bus 🚞💪

___

## PARTIE N°1

## ⚙️ Installation et import des bibliothèques

In [None]:
import geopandas as gpd
import shapely
import pandas as pd
import numpy as np
import folium
import matplotlib.pyplot as plt
import plotly.express as px
import plotly.graph_objects as go
from shapely.geometry import Point, LineString, Polygon, LinearRing

## 📚 Liens vers la documentation des bibliothèques

### Manipulation de données

- <a href="https://pandas.pydata.org" target="_blank">Pandas</a>

Permet de manipuler et d’analyser des données tabulaires avec des structures comme les DataFrames.

### Géométrie et données géospatiales

- <a href="https://shapely.readthedocs.io/en/stable/index.html" target="_blank">Shapely</a>

Fournit des outils pour la manipulation de formes géométriques (points, lignes, polygones).

- <a href="https://geopandas.org/en/stable/" target="_blank">GeoPandas</a>

Étend Pandas pour gérer des données géographiques (GeoDataFrames) et facilite les opérations géospatiales.

### Visualisation de données

- <a href="https://matplotlib.org" target="_blank">Matplotlib</a>

Bibliothèque de base pour créer des graphiques statiques en 2D de manière personnalisable.

- <a href="https://plotly.com/python/" target="_blank">Plotly</a>

Permet de créer des visualisations interactives (grâce au Javascript), notamment des cartes et des graphiques 3D.

- <a href="https://python-visualization.github.io/folium/latest/" target="_blank">Folium</a>

Sert à créer des cartes interactives basées sur Leaflet.js, à partir de données Python.

## 🗂️ Sources et formats de données

- [🚌 Navettes saisonnières Transaltitude - Isère](https://transport.data.gouv.fr/datasets/desserte-des-stations-de-ski-iseroises-transaltitude-38)

## 🗺️ Visualisation de géométries avec Folium – Exemple sur Grenoble

Dans ce code, nous utilisons les bibliothèques Folium et Plotly pour créer une carte interactive centrée sur Grenoble. Nous y ajoutons ensuite différentes formes géométriques courantes utilisées en cartographie :

- 📍 Point
- ➖ Ligne (LineString)
- 🔲 Polygone

**Activité :**

Modifier la liste `polygon = [...]` afin que le polygone encadre précisément le parc Paul Mistral à Grenoble`

In [None]:
# Initialiser une carte centrée sur Grenoble
m = folium.Map(location=[45.188, 5.724], zoom_start=14)

# 1. Point
folium.Marker(location=[45.188, 5.724], popup="Point").add_to(m)

# 2. Ligne (LineString)
folium.PolyLine(
    locations=[[45.188, 5.724], [45.189, 5.726], [45.190, 5.728]],
    color='red',
    weight=2.5,
    popup="LineString"
).add_to(m)

# 3. Polygone
polygon = [
    [45.186, 5.722],
    [45.187, 5.725],
    [45.185, 5.727],
    [45.184, 5.723],
    [45.186, 5.722]
]

folium.Polygon(
    locations=polygon,
    color='purple',
    fill=True,
    fill_color='purple',
    popup="Polygone"
).add_to(m)

# Affichage ou sauvegarde
m

In [None]:
# 1. Point
point = Point(5.724, 45.188)

# 2. Ligne (LineString)
line = LineString([
    (5.724, 45.188),
    (5.726, 45.189),
    (5.728, 45.190)
])

# 3. Polygone
polygon = Polygon([
    (5.722, 45.186),
    (5.725, 45.187),
    (5.727, 45.185),
    (5.723, 45.184),
    (5.722, 45.186)
])

fig = go.Figure()

# 1. Point
fig.add_trace(go.Scattermapbox(
    lon=[point.x], lat=[point.y],
    mode='markers',
    marker=dict(size=10, color='blue'),
    name='Point'
))

# 2. Ligne (LineString)
fig.add_trace(go.Scattermapbox(
    lon=[coord[0] for coord in line.coords],
    lat=[coord[1] for coord in line.coords],
    mode='lines',
    line=dict(width=4, color='red'),
    name='LineString'
))

# 3. Polygone
fig.add_trace(go.Scattermapbox(
    lon=[coord[0] for coord in polygon.exterior.coords],
    lat=[coord[1] for coord in polygon.exterior.coords],
    mode='lines',
    fill='toself',
    fillcolor='rgba(128,0,128,0.3)',
    line=dict(color='purple'),
    name='Polygon'
))

# 3. Configuration de la carte
fig.update_layout(
    mapbox_style='open-street-map',
    mapbox_zoom=14,
    mapbox_center={'lat': 45.188, 'lon': 5.724},
    margin=dict(l=0, r=0, t=0, b=0)
)

fig.show()

## 🗺️ Récupération de données GeoJSON

Le projet Github france-geojson propose au format GeoJSON les cartes des **régions, départements, arrondissements, cantons et communes de France (métropole et départements d'outre-mer)** à partir des données publiées par l'<a href="https://www.ign.fr" target="_blank">IGN</a> et l'<a href="https://www.insee.fr/fr/accueil" target="_blank">INSEE</a>. Lien vers le site : https://france-geojson.gregoiredavid.fr

**Activité :**

- Récupérer l'url du fichier **GeoJSON** de l'**isère** sur le site france-geojson
- Avec <a href="https://geopandas.org/en/stable/" target="_blank">GeoPandas</a>, insérer les données dans un **GeoDataframe** (à l'aide de la fonction <a href="https://geopandas.org/en/stable/docs/reference/api/geopandas.read_file.html" target="_blank">geopandas.read_file()</a>)
- Afficher ces données sur une **carte** (avec Matplotlib ou Folium) avec **toutes bonnes pratiques de cartographie** (à l'aide de la méthode <a href="https://geopandas.org/en/stable/docs/reference/api/geopandas.GeoDataFrame.plot.html" target="_blank">geopandas.GeoDataFrame.plot()</a> ou de la méthode <a href="https://geopandas.org/en/stable/docs/reference/api/geopandas.GeoDataFrame.explore.html" target="_blank">geopandas.GeoDataFrame.explore()</a> )

In [None]:
# A COMPLETER

## 🌍 Choix du système de coordonnées de référence (CRS)

La propriété <a href="https://geopandas.org/en/stable/docs/reference/api/geopandas.GeoSeries.area.html" target="_blank">geopandas.GeoSeries.area</a> permet de récupérer la surface des élèments d'une géométrie.

**Activité :**

- Récupérer la **surface du département de l'isère**. Pourquoi cet avertissement ? (aide avec la propiété <a href="https://geopandas.org/en/stable/docs/reference/api/geopandas.GeoDataFrame.crs.html" target="_blank">geopandas.GeoDataFrame.crs</a>)
- Changer de système de coordonnées de référence pour passer en **Web Mercator (EPSG:3857)** grâce à la méthode <a href="https://geopandas.org/en/stable/docs/reference/api/geopandas.GeoDataFrame.to_crs.html" target="_blank">geopandas.GeoDataFrame.to_crs()</a>. Est-ce la bonne valeur de la surface ? Pourquoi ?
- Changer de système de coordonnées de référence pour passer en **RGF93 / Lambert-93 (EPSG:2154)**

In [None]:
# A COMPLETER

## 🚌 Affichage des navettes saisonnières Transaltitude - Isère

Les **navettes hivernales desservant 14 stations de ski de l’Isère** peuvent être récupérées à cette adresse au format **GeoJSON** : https://transport.data.gouv.fr/datasets/desserte-des-stations-de-ski-iseroises-transaltitude-38

**Activité :**

- **Récupérer** les données dans un **GeoDataframe**
- **Afficher** les données sur une **carte**
- **Analyser** la qualité de la donnée
- Trouver d'autres jeux de données intéressants pour les transports sur le site : https://data.metropolegrenoble.fr/

In [None]:
# A COMPLETER

## 📏 Calcul de distances

Lorsqu’on manipule des données géographiques (par exemple des points GPS, des routes ou des zones urbaines), il est souvent nécessaire de mesurer des distances précises. Les deux fonctions suivantes permettent de répondre à deux besoins fréquents :

### Fonction `dist_coor_gps(lat1, lon1, lat2, lon2)`

#### ➤ À quoi sert-elle ?
Cette fonction calcule **la distance à vol d’oiseau** entre deux points donnés par leurs coordonnées GPS (latitude et longitude). C’est ce qu’on appelle la **distance géodésique**.

#### ➤ Pourquoi est-ce utile ?
Cela permet de connaître la distance réelle entre deux lieux sur Terre, **sans tenir compte des routes, du relief ou des obstacles**. On l’utilise notamment :
- pour estimer rapidement si deux points sont proches ou éloignés,
- dans des applications de géolocalisation (GPS, cartographie),
- pour calculer des zones d’influence (ex : rayon de 500 m autour d’un magasin).

#### ➤ Comment ça fonctionne ?
Elle utilise la **formule de Haversine**, qui prend en compte la courbure de la Terre pour donner une estimation précise. Elle retourne la distance en **mètres**.

### 2. Fonction `dist_coor_gps_objet(g_point, g_objet)`

#### ➤ À quoi sert-elle ?
Cette fonction calcule la **distance à vol d’oiseau** entre un point (par exemple, une position GPS) et le **bord extérieur d’un polygone** représentant un objet géographique (comme un parc, un bâtiment ou une zone urbaine).

Elle renvoie également le **point exact sur le polygone** qui est le plus proche du point de départ.

#### ➤ Pourquoi est-ce utile ?
Elle permet de :
- mesurer la proximité entre un lieu (comme une gare) et une zone (par exemple, un parc),
- déterminer automatiquement **le point d’entrée le plus proche** dans une zone fermée,
- analyser la distance minimale entre des entités géographiques.

#### ➤ Comment ça fonctionne ?
1. La fonction vérifie que l’objet fourni est un polygone.
2. Elle extrait le **contour extérieur** du polygone.
3. Elle calcule le **point le plus proche** du polygone par rapport au point donné.
4. Elle utilise la fonction `dist_coor_gps` pour calculer la **distance en mètres** entre le point initial et ce point le plus proche.

**Activité :**

- Calculer la distance de la gare de Grenoble à la tour Perret à l'aide de la fonction `dist_coor_gps(lat1, lon1, lat2, lon2)`
- Calculer la distance de la gare de Grenoble au polygone du parc Paul Mistral tracé dans la première partie de ce notebook à l'aide de la fonction `dist_coor_gps_objet(g_point, g_objet)`
- Afficher sur une carte le point du polygone du parc Paul Mistral le plus proche de la gare de Grenoble

In [None]:
def dist_coor_gps(lat1,lon1,lat2,lon2):
    """
    This uses the ‘haversine’ formula to calculate the great-circle distance between two points – that is, 
    the shortest distance over the earth’s surface – giving an ‘as-the-crow-flies’ distance between the points 
    (ignoring any hills they fly over, of course!).
    Haversine
    formula:    a = sin²(Δφ/2) + cos φ1 ⋅ cos φ2 ⋅ sin²(Δλ/2)
    c = 2 ⋅ atan2( √a, √(1−a) )
    d = R ⋅ c
    where   φ is latitude, λ is longitude, R is earth’s radius (mean radius = 6,371km);
    note that angles need to be in radians to pass to trig functions!
    """
    R = 6371.0088
    lat1,lon1,lat2,lon2 = map(np.radians, [lat1,lon1,lat2,lon2])

    dlat = lat2 - lat1
    dlon = lon2 - lon1
    a = np.sin(dlat/2)**2 + np.cos(lat1) * np.cos(lat2) * np.sin(dlon/2) **2
    c = 2 * np.arctan2(a**0.5, (1-a)**0.5)
    d = R * c * 1000 #en mètres
    return round(d,4)

def dist_coor_gps_objet(g_point, g_objet):
    """
    Calcule la distance à vol d’oiseau entre un point et le bord d’un objet géographique de type Polygon,
    et renvoie également le point le plus proche sur le polygone.

    Parameters
    ----------
    g_point : shapely.geometry.Point
        Le point de référence (ex. : position GPS de départ).
        
    g_objet : shapely.geometry.Polygon
        L'objet géographique (ex. : parc, bâtiment) sous forme de polygone.
        Seul le contour extérieur est pris en compte.

    Returns
    -------
    distance : float
        Distance en mètres entre le point et le bord le plus proche du polygone.
        
    point_proche : shapely.geometry.Point
        Point situé sur le bord du polygone, le plus proche de `g_point`.

    Raises
    ------
    TypeError
        Si l'objet fourni n'est pas un polygone.
    
    Notes
    -----
    La distance est calculée à l’aide de la formule de Haversine,
    en considérant la Terre comme une sphère de rayon moyen 6371 km.
    """
    if isinstance(g_objet, Polygon):
        line = LinearRing(g_objet.exterior.coords)
    else:
        raise TypeError("Type géométrique non supporté")
        
    d = line.project(g_point)
    p = line.interpolate(d)
    return dist_coor_gps(g_point.y, g_point.x, p.y, p.x), p

In [None]:
# A COMPLETER

## 🌍 Récupération de données avec Overpass Turbo

Lien vers les ressources :
- site : https://overpass-turbo.eu/-
- documentation : https://wiki.openstreetmap.org/wiki/Overpass_turbo

La requête pour télécharger les arrêts de bus de l'Isère :

```bash
[out:json][timeout:25];
area["name"="Isère"]->.isere;
node["highway"="bus_stop"](area.isere);out body;>;out skel qt;
```

Et la requête pour télécharger les sentiers de rando de l'Isère : 

```bash
[out:json][timeout:50];
area["name"="Isère"]->.isere;
(  way["route"="hiking"](area.isere);  relation["route"="hiking"](area.isere);
  way["highway"~"path|footway"]["sac_scale"](area.isere);  way["highway"~"path|footway"]["trail_visibility"](area.isere);  way["highway"~"path|footway"]["foot"!="no"](area.isere););out body;>;out skel qt;
```

## PARTIE N°2

A partir des données de transports récupérés sur le site des données ouvertes de la métropole de Grenoble, trouver la **ligne de bus la plus proche** de ce **point de départ de randonnée** `(45.066669, 5.63333)`. Commencer par **afficher** toutes les données utiles sur la carte puis **calculer** les distances utiles.

In [None]:
# A COMPLETER