# TimeSliderChoropleth : afficher une carte choropleth en fonction du temps

## Importer les modules

In [1]:
## Manipuler les données
import pandas
import geopandas
import os
import json

## Traitement
import shapely
import numpy
import datetime

## Afficher
import matplotlib.pyplot as plt
import seaborn
import branca
from branca.colormap import linear

## Valoriser les données
import folium
from folium.plugins import TimeSliderChoropleth

## Importer les données

In [2]:
acc = geopandas.read_file(".\\RESULTATS\\accidents_velos_gpsea.shp",
                          geometry="geometry",
                         encoding="utf-8")
acc.head()

Unnamed: 0,Num_Acc,jour,mois,an,hrmn,lum,dep,com,agg,int,atm,col,adr,id_vehicul,num_veh,senc,catv,nb_acc,geometry
0,202100001508,22,12,2021,13:05,1,94,94002,2,2,1,3,Rue Joffrin,b'199\xa0097',Z01,1,0,1,POINT (2.42708 48.79984)
1,202100002052,19,12,2021,16:40,1,94,94002,2,2,1,3,EMILE ZOLA (R),b'198\xa0126',A01,1,1,1,POINT (2.42079 48.79825)
2,202100002476,17,12,2021,06:50,5,94,94002,2,4,1,3,b'Quai de la R\xe9volution',b'197\xa0344',A01,1,1,1,POINT (2.41725 48.77855)
3,202100010746,26,10,2021,20:15,5,94,94011,2,9,1,3,Avenue de Paris,b'182\xa0520',B01,1,1,1,POINT (2.48022 48.77579)
4,202100011432,23,10,2021,01:45,5,94,94011,2,9,1,2,b'Carrefour du-G\xe9n\xe9ral-de-Gaulle',b'181\xa0289',B01,2,1,1,POINT (2.48778 48.76797)


In [3]:
gpsea = geopandas.read_file(".\\DONNEES\\contours_gpsea.geojson",
                          encoding="utf-8",
                          geometry="geometry")

## Puis mise à jour de la table :
gpsea = gpsea[ ["geometry", "id", "nom_de_la_commune", "code_insee_commune"] ]

gpsea.head()

Unnamed: 0,geometry,id,nom_de_la_commune,code_insee_commune
0,"POLYGON ((2.40940 48.81656, 2.41070 48.81640, ...",COMMUNE_0000000009737012,Alfortville,94002
1,"POLYGON ((2.49299 48.75928, 2.49687 48.76091, ...",COMMUNE_0000000009737008,Boissy-Saint-Lger,94004
2,"POLYGON ((2.51245 48.78479, 2.51218 48.78390, ...",COMMUNE_0000000009737007,Bonneuil-sur-Marne,94011
3,"POLYGON ((2.57154 48.79888, 2.56744 48.79723, ...",COMMUNE_0000000009736516,Chennevires-sur-Marne,94019
4,"POLYGON ((2.42825 48.77610, 2.42883 48.78018, ...",COMMUNE_0000000009737006,Crteil,94028


## 1. Préparer les données pour timeSliderChoropleth

Construction des paramètres de la fonction :
![image.png](attachment:image.png) 

### 1.1 Préparer le paramètre data
- data semble être un unique jeu de données qui contient à la fois information et géométrie

In [4]:
acc = acc[ ["mois", "an", "com", "nb_acc"] ] ## sélection
acc.head()

Unnamed: 0,mois,an,com,nb_acc
0,12,2021,94002,1
1,12,2021,94002,1
2,12,2021,94002,1
3,10,2021,94011,1
4,10,2021,94011,1


Pour utiliser une date dans folium et python, on va devoir avoir un format spécifique.
Il existe des cas où le mois exprimé en nombre est un chiffre.

In [5]:
if type(acc.mois) != int :
    acc["mois"] = acc["mois"].astype(int)
    
    ## le mois pouvant être un numéro, on va le modifier de sorte qu'il soit reconnu par Python comme une date :
    for i, r in acc.iterrows() :
        if r["mois"] in (list(range(1,10))) :
            mm = r["mois"]
            acc.loc[i, "mois"] = f"0{mm}"

In [6]:
## Créer une date :
acc["datetime"] = ""
for i, r in acc.iterrows() :
    aa = r["an"]
    mm = r["mois"]
    
    acc.loc[i, "datetime"] = f"{aa}-{mm}"

In [7]:
acc_ = acc.groupby(by=["datetime", "com"], as_index=False).sum()
acc_.head()

  acc_ = acc.groupby(by=["datetime", "com"], as_index=False).sum()


Unnamed: 0,datetime,com,nb_acc
0,2021-01,94028,1
1,2021-02,94028,3
2,2021-03,94002,2
3,2021-03,94028,1
4,2021-04,94028,2


Donc là, on a récupéré une table avec plusieurs géométrie : une par champ mois-annee

### 1.1.2 Création d'un geojson

In [8]:
## il nous faut une table d'information sans géométrie obligatoire
## cette table doit pouvoir être jointe avec une table avec géométrie

## pour plotter un map avec TimeSliderChoropleth, on a besoin d'un geojson des lieux et d'une table avec les données.
## Les données lue par le plugin doivent avoir un format spécifique. 
## dict = { "index_matching_geojson" : {"time_milliseconds" : {"color":"#ffffff"} } }

In [9]:
## Donc on doit préparer la données :

## Si le datetime est object de Pandas, alors il faut le transformer en datetime.
## Le champ qui va contenir l'identifiant dans la table est très important, vu que c'est avec lui qu'on va faire matcher nos deux tables.
## Si besoin, apporter des corrections.

## TimeSliderChoropleth ne fonctionne pas très bien avec les str contenant des espaces. 
## Dans ce cas, on peut : indexer les noms avec des valeurs numériques, corriger. 
## Dans le tutoriel, il indexe avec des valeurs numériques en str.

In [10]:
## Mtn, on va assigner une couleur pour chaque jour de chaque nb_acc, le nb_acc.
bins = numpy.linspace(min(acc_["nb_acc"]), max(acc_["nb_acc"]), 4)
## là on a réalisé un découpage en 10 parts égales.
## Nous on va plutôt faire 3 !

In [11]:
## Mtn, assignons une couleur à chaque jour, pour chaque état/commune et la variable quantitative à représenter.
## Bien choisir la variation des couleurs :
## créer un champ de couleur dans la table :
acc_["col"] = pandas.cut( acc_["nb_acc"], bins, labels=["#ffbe0b", "#fb5607", "#d90429"], include_lowest=True )

In [12]:
## colorier les communes NA
acc_["col"].replace(numpy.nan, "#000000", inplace=True)

In [13]:
acc_.head()

Unnamed: 0,datetime,com,nb_acc,col
0,2021-01,94028,1,#ffbe0b
1,2021-02,94028,3,#d90429
2,2021-03,94002,2,#fb5607
3,2021-03,94028,1,#ffbe0b
4,2021-04,94028,2,#fb5607


In [14]:
## On a besoin que de 3 colonnes pour notre analyse :
## acc_ = acc_[ ["datetime", "com", "col"] ]
## la date étant initialement en aaaa-mm-dd
## com_id étant l'identifiant de la commune
## col : la colonne précédemment créée pour contenir les couleurs

In [15]:
## au final, on a mtn une table sans géométrie avec date, id_com et la couleur.

In [16]:
activate = False

if activate == True :

    ## Mtn, on va traiter les communes sans information :
    for date in acc_["datetime"].unique() :
        diff = set([str(i) for i in range(16)]) - set(acc_[acc_["datetime"] == date]["com"])

        for i in diff :
            acc_ = pandas.concat([acc_, pandas.DataFrame([ [date, "#0073CF", i] ], 
                                                         columns=["datetime", "col", "com"])], ignore_index=True)
    print("Seconde indexation non réalisée")

In [17]:
acc_.sort_values("datetime", inplace=True)

In [18]:
acc_

Unnamed: 0,datetime,com,nb_acc,col
0,2021-01,94028,1,#ffbe0b
1,2021-02,94028,3,#d90429
2,2021-03,94002,2,#fb5607
3,2021-03,94028,1,#ffbe0b
4,2021-04,94028,2,#fb5607
5,2021-04,94044,1,#ffbe0b
6,2021-04,94071,1,#ffbe0b
7,2021-05,94002,1,#ffbe0b
8,2021-05,94028,1,#ffbe0b
9,2021-05,94071,1,#ffbe0b


In [19]:
## passer le datetime en type datetime puis en secondes depuis epoch :
acc_["from_epoch"] = numpy.nan

for i, r in acc_.iterrows() :
    temp = datetime.datetime.strptime(f'{r["datetime"]}-01', "%Y-%m-%d")
    
    epoch_time = datetime.datetime(1970, 1, 1)
    
    delta = (temp - epoch_time)
    acc_.loc[i, "from_epoch"] = delta.total_seconds()

In [20]:
acc_

Unnamed: 0,datetime,com,nb_acc,col,from_epoch
0,2021-01,94028,1,#ffbe0b,1609459000.0
1,2021-02,94028,3,#d90429,1612138000.0
2,2021-03,94002,2,#fb5607,1614557000.0
3,2021-03,94028,1,#ffbe0b,1614557000.0
4,2021-04,94028,2,#fb5607,1617235000.0
5,2021-04,94044,1,#ffbe0b,1617235000.0
6,2021-04,94071,1,#ffbe0b,1617235000.0
7,2021-05,94002,1,#ffbe0b,1619827000.0
8,2021-05,94028,1,#ffbe0b,1619827000.0
9,2021-05,94071,1,#ffbe0b,1619827000.0


In [21]:
acc_[ acc_["com"] == 94028 ].values

array([], shape=(0, 5), dtype=object)

In [22]:
d = dict()

for i in acc_["com"].unique() :
    d[i] = dict()
    
    for j in acc_[ acc_["com"] == i ].set_index(["com"]).values :
        d[i][ str(int(j[3])) ] = {"color" : j[2], "opacity":0.7} 

## résultat attendu : un dictionnaire qui a une clé qui représente l'id de la commune,
##+ et qui prend en valeur toutes les datetimes la concernant et y associe un dictionnaire 
##+ de style.

In [23]:
d

{'94028': {'1609459200': {'color': '#ffbe0b', 'opacity': 0.7},
  '1612137600': {'color': '#d90429', 'opacity': 0.7},
  '1614556800': {'color': '#ffbe0b', 'opacity': 0.7},
  '1617235200': {'color': '#fb5607', 'opacity': 0.7},
  '1619827200': {'color': '#ffbe0b', 'opacity': 0.7},
  '1622505600': {'color': '#fb5607', 'opacity': 0.7},
  '1630454400': {'color': '#ffbe0b', 'opacity': 0.7},
  '1633046400': {'color': '#ffbe0b', 'opacity': 0.7}},
 '94002': {'1614556800': {'color': '#fb5607', 'opacity': 0.7},
  '1619827200': {'color': '#ffbe0b', 'opacity': 0.7},
  '1627776000': {'color': '#ffbe0b', 'opacity': 0.7},
  '1638316800': {'color': '#d90429', 'opacity': 0.7}},
 '94044': {'1617235200': {'color': '#ffbe0b', 'opacity': 0.7},
  '1630454400': {'color': '#ffbe0b', 'opacity': 0.7}},
 '94071': {'1617235200': {'color': '#ffbe0b', 'opacity': 0.7},
  '1619827200': {'color': '#ffbe0b', 'opacity': 0.7},
  '1622505600': {'color': '#ffbe0b', 'opacity': 0.7}},
 '94011': {'1622505600': {'color': '#ffbe0

In [24]:
gpsea.dtypes ## code_insee_commune en int64
## on doit convertir pour assurer la jointure :
gpsea["code_insee_commune"] = gpsea["code_insee_commune"].astype(str)
gpsea.dtypes ## OK

geometry              geometry
id                      object
nom_de_la_commune       object
code_insee_commune      object
dtype: object

In [25]:
activate = False

if activate == True :
    ## Mtn, on va s'occuper du geojson. Normalement, on doit juste assurer que la jointure soit possible.
    ## pour ça, on rappelle qu'on a un code insee, qui est associé à chaque commune.
    ## On fait alors :
    gpsea["id"] = gpsea["id"].map(id_dic) ## on fait matcher à chaque commune son code INSEE.

### 1.2 Préparer le styledict

Doit prendre la forme : styledict (dict) – A dictionary where the keys are the geojson feature ids and the values are dicts of {time: style_options_dict}.
Dans une fonction folium, feature est fourni automatique par lui-même. On peut aller voir la documentation ici : https://python-visualization.github.io/folium/quickstart.html#Styling-function

style_dict = {
    (timestamp1, geometry_id1): {
        'fillColor': 'red',
        'fillOpacity': 0.5,
        'color': 'white',
        'weight': 1
    },

## 2. Afficher ses données avec timeSliderChoropleth

## 2.1 Créer une carte folium

In [26]:
gpsea.head()

Unnamed: 0,geometry,id,nom_de_la_commune,code_insee_commune
0,"POLYGON ((2.40940 48.81656, 2.41070 48.81640, ...",COMMUNE_0000000009737012,Alfortville,94002
1,"POLYGON ((2.49299 48.75928, 2.49687 48.76091, ...",COMMUNE_0000000009737008,Boissy-Saint-Lger,94004
2,"POLYGON ((2.51245 48.78479, 2.51218 48.78390, ...",COMMUNE_0000000009737007,Bonneuil-sur-Marne,94011
3,"POLYGON ((2.57154 48.79888, 2.56744 48.79723, ...",COMMUNE_0000000009736516,Chennevires-sur-Marne,94019
4,"POLYGON ((2.42825 48.77610, 2.42883 48.78018, ...",COMMUNE_0000000009737006,Crteil,94028


In [27]:
m = folium.Map(location=[48.862725, 2.287592], zoom_start=12, tiles="OpenStreetMap")

## 2.2 Ajouter TimeSliderChoropleth

In [28]:
activate = False
if activate == True : ## on va ajouter nos données sur la carte directement, pour voir si elle s'affichent :
    tempGEO = tempGEO.to_crs(3857)
    folium.GeoJson(tempGEO, name="geojson").add_to(m)
else :
    print("Le fond des communes ne sera pas affiché")
    
g = TimeSliderChoropleth(
    gpsea.set_index('code_insee_commune').to_json(),
    styledict=d,
).add_to(m)

m

Le fond des communes ne sera pas affiché


## 2.3 Préparer la fonctionnalité
[Voir la documentation](https://python-visualization.github.io/folium/plugins.html)  
[Créer une carte TimeSliderChoropleth](https://www.analyticsvidhya.com/blog/2020/06/guide-geospatial-analysis-folium-python/)