**GEO6361 (semaine 8) : Les opérations spatiales avec GeoPandas**

Cette semaine, nous allons nous intéresser à quelques opérations fondamentales des SIG qu'il nous est possible d'effectuer avec GeoPandas.

## **1. Opérations spatiales avec GeoPandas**

### **1.1 Installons les modules requis pour cette section, et importons-les**

In [None]:
import pandas as pd # On importe pandas, on lui attribut l'alias pd
import geopandas as gpd # On importe GeoPandas et on lui attribut l'alias gpd

### **1.2 Création d'objets spatiaux avec GeoPandas**

**Commençons par créer les point de ces stations** (pour ça, on importe également quelques outils de création d'objets spatiaux d'un autre module externe : Shapely (https://github.com/shapely/shapely), qui est fortement utilisé par GeoPandas pour représenter ses entités spatiales)

In [None]:
from shapely.geometry import Polygon, LineString, Point # On peut importer différents types de géométries, même si nous n'utiliserons que "Point" aujourd'hui

Les objets spatiaux Shapely peuvent être créés à partir de liste de coordonnées :

**Quelle distance sépare ces deux points ?** Utilisons la méthode "[distance](https://geopandas.org/en/stable/docs/reference/api/geopandas.GeoSeries.distance.html)" de GeoPandas :

La méthode "distance" fournie un résultat dans l'unité du système de coordonnées des points. Les coordonnées géographiques étant exprimées en angles, la distance est exprimée en degrées. **Si l'on souhaite des résultats en mètres, nous devons au préalable reprojeter nos données avec "[to_crs](https://geopandas.org/en/stable/docs/reference/api/geopandas.GeoDataFrame.to_crs.html)"** :

### **1.3 Création d'une zone tampon ("buffer") de 500m autour de ces deux points**

**On peut ensuite produire une géométrie du "[buffer](https://geopandas.org/en/stable/docs/reference/api/geopandas.GeoSeries.buffer.html)" de la manière suivante :**

### **1.4 Quelle est la superficie de la zone totale ?**

**Nous pouvons agréger ces polygones avec une union géométrique ("[union_all](https://geopandas.org/en/stable/docs/reference/api/geopandas.GeoSeries.union_all.html)")**

In [None]:
# Créer la géométrie correspondant à l'aggregation des polygones du GeoDataFrame en utilisant la méthode union_all()


# Créer une GeoDataFrame à partir de cette géométrie (pour pouvoir bénéficier des méthodes de GeoPandas)


# Renseigner son CRS


**Et obtenir la superficie et le pémimètre en appelant "[area](https://geopandas.org/en/stable/docs/reference/api/geopandas.GeoSeries.area.html)" puis "[length](https://geopandas.org/en/stable/docs/reference/api/geopandas.GeoSeries.length.html)" sur cet objet :**

In [None]:
# Calculons la superficie :

# Calculons le périmètre :


In [None]:
# On peut aussi exporter cet objet pour l'utiliser dans une autre application :


### **1.5 Quelle est la superficie de la zone située à la fois à moins de 500m de la station Acadie, et à moins de 500m de la station Outremont ?**

**Nous pouvons utiliser la fonction "[intersection](https://geopandas.org/en/stable/docs/reference/api/geopandas.GeoSeries.intersection.html)" sur la GeoDataFrame où les tampons sont séparés (c'est à dire, pas sur la version "union")**

In [None]:
# Créer la géométrie correspondant à l'intersection des polygones du GeoDataFrame en utilisant la méthode intersect()


# Calculons la superficie de cette géométrie


In [None]:
# Créer une GeoDataFrame à partir de cette géométrie (pour pouvoir bénéficier des méthodes de GeoPandas)


### **1.6 Quelle est la superficie des deux buffers à l'exeption de leur zone commune ?**

## **2. Une application un peu plus poussée**

Nous avons vu une application simple des opérations de "**buffer**", d'**union**, d'**intersection**, et de **différence**, et des calculs de **superficie** et de **périmètres**.
Allons plus loin avec une application plus poussée : essayons de calculer des statistiques sur une base de données en fonction de distances par rapport aux éléments d'une autre base de données.

Plus précisément, nous allons prendre une base de données spatiale de prix de biens immobiliers, et explorer le rapport entre ces prix et leur distance aux stations de métro de Montréal.

### **1.2 Chargeons les données**

 Chargeons tout d'abord les données sur les biens immobiliers en vente pour 2023 :

In [None]:
# On charge le fichier contenant les données spatiales à analyser dans une GDF


**Comme nous ne nous interressons qu'aux données de l'île de Montréal, excluons les points qui sont situés à l'extérieur. Pour accomplir cela, on peut numériser le contour de l'île avec QGIS ou geojson.io** (un fichier masque_mtl.geojson a été préparé pour ça), et "clipper" les points par rapport à celui-ci.

In [None]:
# Charger un fichier GeoJSON contenant un masque de l'île de Montréal


In [None]:
# On découpe (ou "clippe") les données avec le masque de Montréal


**Lisons maintenant la carte des stations de métro de la STM**

In [None]:
# Charger un fichier GeoJSON contenant les stations de métro de Montréal (https://www.stm.info/fr/a-propos/developpeurs)


In [None]:
# Créer un buffer de 500 mètres autour des stations de métro


In [None]:
# Créer la géométrie correspondant à l'agregation des polygones du GeoDataFrame

# Créer une GeoDataFrame à partir de cette géométrie


### **2.3. Faire une jointure spatiale pour calculer les prix à l'intérieur des buffers**

**Nous voudrions sélectionner les biens immobiliers qui sont géographiquement localisés à l'intérieur d'une géométrie.**

In [None]:
# Effectuer la jointure spatiale


### **2.4. Et si nous voulions automatiser tout ça ?**

In [None]:
import seaborn as sns # On importe le module de visualisation Seaborn...
import numpy as np # Et Numpy qui nous sera également utile