In [26]:
import contextily as ctx
import folium
import geopandas as gpd
import numpy as np
import pandas as pd
import requests

from folium.plugins import GroupedLayerControl


# Carte des quartiers de Marseille

In [27]:
# Importation des données géographiques des quartiers de Marseille
url = 'https://www.data.gouv.fr/api/1/datasets/r/8a8f7f54-7f91-482c-a78c-dd09d893d1b6'
file = requests.get(url)
data = file.content
quartiers_data = gpd.read_file(data)
quartiers_map = quartiers_data.rename({'NOM_QUA' : 'Quartier'}, axis = 1)

# Préparation du gdf d'adresses

In [28]:
# liens de téléchargement pour les 16 arrondissements
url_data = [
    'https://www.data.gouv.fr/api/1/datasets/r/84b5a6c5-5c0f-4518-8f6e-6e00b5fcacda',
    'https://www.data.gouv.fr/api/1/datasets/r/b5f2a20b-5951-4698-9b11-b86c51940eab',
    'https://www.data.gouv.fr/api/1/datasets/r/39aedda3-9479-40d5-97cf-405374813e09',
    'https://www.data.gouv.fr/api/1/datasets/r/c7126419-50d2-4eeb-9f9f-cca76e0ba4cf',
    'https://www.data.gouv.fr/api/1/datasets/r/15f80a80-34a2-47b7-80b8-fed1cde87f64',
    'https://www.data.gouv.fr/api/1/datasets/r/2b657228-e856-4b16-bd6e-d6fbeaf0b644',
    'https://www.data.gouv.fr/api/1/datasets/r/7659198f-da95-46d3-918a-f1c89db62131',
    'https://www.data.gouv.fr/api/1/datasets/r/04a47775-3b5a-4ed7-9d17-6dcc17adf47a',
    'https://www.data.gouv.fr/api/1/datasets/r/46c4de02-f529-4a42-8f24-cdc12e55e35c',
    'https://www.data.gouv.fr/api/1/datasets/r/699d4429-dd09-4978-adc8-78afab7aecc7',
    'https://www.data.gouv.fr/api/1/datasets/r/364bebd5-6762-493d-bb9a-a25d4e11edf1',
    'https://www.data.gouv.fr/api/1/datasets/r/ea5017ad-5e8b-4186-b560-07ea77960c94',
    'https://www.data.gouv.fr/api/1/datasets/r/c7024730-396d-4f0a-a238-e638fffade11',
    'https://www.data.gouv.fr/api/1/datasets/r/b0fefb17-69aa-45f2-b09e-0c29cb2cd689',
    'https://www.data.gouv.fr/api/1/datasets/r/da06caf0-2cc6-4282-82c6-e8da1a57d3ed',
    'https://www.data.gouv.fr/api/1/datasets/r/ee39eb43-74f7-490c-b728-2fea9d34dfeb'
    ]


In [29]:
# initialisation du df d'adresses avec le premier arrondissement
adresses = pd.read_csv(url_data[0], sep = ';')

# boucle de concaténation des autres attondissements
for url in url_data[1:]:
    data = pd.read_csv(url, sep = ";")
    adresses = pd.concat([adresses, data], axis = 0, ignore_index = True)

adresses

# À noter : variables 'x' et 'y' dans le système Lambert93 / variables 'long' et 'lat' dans le système WGS 

Unnamed: 0,uid_adresse,cle_interop,commune_insee,commune_nom,commune_deleguee_insee,commune_deleguee_nom,voie_nom,lieudit_complement_nom,numero,suffixe,position,x,y,long,lat,cad_parcelles,source,date_der_maj,certification_commune
0,90259,13201_2838_00002,13201,1er arrondissement,,,Rue docteur claudius regaud,belsunce,2,,entrée,892909.23,6247635.35,5.376411,43.301756,131201801 A0355,commune,2022-11-24,1
1,75934,13201_0056_00020,13201,1er arrondissement,,,Rue de l' academie,noailles,20,,entrée,893278.13,6246964.78,5.380704,43.295626,131201803 B0107,commune,2022-11-24,1
2,75936,13201_0056_00024,13201,1er arrondissement,,,Rue de l' academie,noailles,24,,entrée,893289.00,6246979.84,5.380844,43.295759,131201803 B0110,commune,2022-11-24,1
3,89905,13201_0056_00001,13201,1er arrondissement,,,Rue de l' academie,noailles,1,,entrée,893225.91,6246907.13,5.380040,43.295122,131201803 A0237,commune,2022-11-24,1
4,75937,13201_0056_00026,13201,1er arrondissement,,,Rue de l' academie,noailles,26,,entrée,893294.50,6246987.48,5.380914,43.295826,131201803 B0111,commune,2022-11-24,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
91640,13831,13216_4691_00001,13216,16e arrondissement,,,Rue jean jacques vernazza,l'estaque,1,,entrée,888369.33,6254229.65,5.322907,43.362266,131216908 E0205,commune,2022-11-24,1
91641,107641,13216_z436_00011,13216,16e arrondissement,,,Rue kader tighilt,l'estaque,11,,entrée,888244.97,6254142.45,5.321343,43.361515,131216908 E0459,commune,2022-11-24,1
91642,84948,13216_0774_00059,13216,16e arrondissement,,,Traverse de la barre,saint andre,59,,entrée,890202.73,6254707.15,5.345678,43.366072,131216910 A0067,commune,2022-11-24,1
91643,84949,13216_0774_00049,13216,16e arrondissement,,,Traverse de la barre,saint andre,49,,entrée,890208.32,6254653.90,5.345727,43.365592,131216910 A0056,commune,2022-11-24,1


In [30]:
adresses = adresses[['commune_insee', 'commune_nom', 'lieudit_complement_nom', 'long', 'lat']]
adresses = adresses.rename({'lieudit_complement_nom' : 'Quartier'}, axis = 1)

In [31]:
adresses

Unnamed: 0,commune_insee,commune_nom,Quartier,long,lat
0,13201,1er arrondissement,belsunce,5.376411,43.301756
1,13201,1er arrondissement,noailles,5.380704,43.295626
2,13201,1er arrondissement,noailles,5.380844,43.295759
3,13201,1er arrondissement,noailles,5.380040,43.295122
4,13201,1er arrondissement,noailles,5.380914,43.295826
...,...,...,...,...,...
91640,13216,16e arrondissement,l'estaque,5.322907,43.362266
91641,13216,16e arrondissement,l'estaque,5.321343,43.361515
91642,13216,16e arrondissement,saint andre,5.345678,43.366072
91643,13216,16e arrondissement,saint andre,5.345727,43.365592


In [32]:
# Conversion en geodataframe
gdf_adresses = gpd.GeoDataFrame(
    adresses,
    geometry=gpd.points_from_xy(
        adresses['long'],
        adresses['lat'],
        crs="EPSG:4326"))


# Préparation du gdf de pav

In [33]:
# Importation des données concernant les points d'apport volontaire
url = 'https://www.data.gouv.fr/api/1/datasets/r/e46c6879-49e7-4727-8f3b-62df90ac5a5a'
gouv_data = pd.read_csv(url, sep = ';')

In [34]:
# Extraction des variables d'intérêt
pav_data = gouv_data[['OBJECTID', 'Code Commune INSEE', 'Quartier', 'Volume intérieur m3', 'longitude', 'latitude', 'Type de flux']]

# Extraction des observations concernant les quartiers de Marseille
pav = pav_data.loc[(pav_data['Code Commune INSEE'] > 13200) & (pav_data['Code Commune INSEE'] < 13217)]
pav = pav.dropna(axis = 0, subset = ['Quartier'])


# conversion en geodataframe
gdf_pav = gpd.GeoDataFrame(
    pav,
    geometry=gpd.points_from_xy(
        pav['longitude'],
        pav['latitude'],
        crs="EPSG:4326"))


In [35]:
# Le format .shp limite à 10 caractères le nom des variables
# On remplace les types de flux par des abréviations pour faciliter
# le nommage de futures variables


types_dict = {
    'Verre' : 'V',
    'Biflux' : 'Bf',
    'OM' : 'OM',
    'Biodechets' : 'Bio',
    'Textile' : 'T',
    'Papier / Journaux' : 'P',
    'Emballage' : 'E',
    'Carton' : 'C'
    }



gdf_pav['Type de flux'] = gdf_pav['Type de flux'].replace(types_dict)


# Uniformisation des noms de quartier

In [36]:
gdf_adresses['Quartier'] = gdf_adresses['Quartier'].apply(lambda x : x.upper())

In [37]:
# Correction des noms de quartiers 

gdf_pav['Quartier'] = gdf_pav['Quartier'].replace(
    {
    'LE ROUCAS' : 'LE ROUCAS BLANC',
    'ST BARNANE' : 'SAINT BARNABE',
    'ROUCAS BLANC' : 'LE ROUCAS BLANC'
    }
)

quartiers_map['Quartier'] = quartiers_map['Quartier'].replace(
    {
        'SAINT MAURON' : 'SAINT MAURONT',
        'VIELLE CHAPELLE' : 'VIEILLE CHAPELLE',
        'GRANDS CARMES' : 'LES GRANDS CARMES',
        'LA VILETTE' : 'LA VILLETTE',
        'CHUTES LAVIE' : 'LES CHUTES LAVIES',
        'CINQ AVENUES' : 'LES CINQ AVENUES',
        'ROUCAS BLANC' : 'LE ROUCAS BLANC',
        'POINTE ROUGE' : 'LA POINTE ROUGE',
        'SAINTE MARGUERITE' : 'STE MARGUERITE',
        'CHATEAU-GOMBERT' : 'CHATEAU GOMBERT'
        

    }
)



# Recherche des pav les plus proches de chaque adresse

In [38]:
gdf_adresses = gdf_adresses.to_crs(2154)
gdf_pav = gdf_pav.to_crs(2154)

In [39]:
# calcul de la distance du pav le plus proche d'une adresse donnée
def distances_pav(adresse, type_pav):
    distance = 1000
    for pav in gdf_pav.loc[gdf_pav['Type de flux'] == type_pav]['geometry']:
        if adresse.distance(pav) < distance:
            distance = adresse.distance(pav)
    return round(distance)



# Chargement du fichier traité / ou traitement du fichier 
try :
    quartiers_dist = gpd.read_file('../data/cache/distances_moyenne_adresses_pav.shp')
    
except :  
    print('Mean distances file not found, generating new file')

    for type in types_dict.values():
        # ajout, dans le gdf d'adresses, des distances du pav le plus proche pour chaque type de flux
        gdf_adresses['dist_' + type] = gdf_adresses['geometry'].apply(lambda x : distances_pav(x, type))
        
    # groupby par quartier avec distance moyenne
    gdf_distance_moyenne = gdf_adresses.dissolve(by = 'Quartier', aggfunc = 'mean', numeric_only = True)
        
    # jointure avec les données des quartiers
    quartiers_dist = quartiers_map.merge(gdf_distance_moyenne.drop(['geometry'], axis = 1), on = 'Quartier', how = 'left')
    
    # save
    quartiers_dist.to_file('../data/cache/distances_moyenne_adresses_pav.shp', index = False)



In [40]:
# arrondi des distances à l'entier
for type in types_dict.values():
    dist_type = 'dist_' + str(type)
    quartiers_dist[dist_type] = quartiers_dist[dist_type].apply(lambda x : round(x) if pd.notnull(x) else np.nan)

In [41]:
# regroupement des distances par intervalles

ref_bins = [0, 50, 100, 150, 200, 300, 500]
ref_labels = ['< 50', '(50, 100]', '(100, 150]', '(150, 200]', '(200, 300]', '(300, 500]', '> 500']
    
# on ne garde que les bins et les labels nécessaires pour chaque colonne
# puis on cut selon les bins retenus
for type in types_dict.values():
    dist_type = 'dist_' + str(type)
    moy_max = round(max(quartiers_dist[dist_type]))
    bins = [bin for bin in ref_bins if bin < moy_max]
    bins.append(moy_max)
    labels = ref_labels[:len(bins)-1]
    quartiers_dist[dist_type + '_cat'] = pd.cut(quartiers_dist[dist_type], bins = bins, labels = labels)

# Génération de la carte

In [42]:
quartiers_dist = quartiers_dist.to_crs(3857)
gdf_pav = gdf_pav.to_crs(3857)

In [43]:
# fond de carte
map = folium.Map(
    location = [43.3, 5.4],
    tiles = 'cartodbpositron',
    zoom_start = 12,
    max_zoom=17,
    control_scale=True
    )


# ajout des couches pour chaque type de flux
layers = {}

for n,type in enumerate(types_dict.values()):
    layer_name = 'fg_'+ type 
    label = list(types_dict.keys())[n]
    layers[layer_name] = folium.FeatureGroup(name = label).add_to(map)

    quartiers_dist.explore(
        m = layers[layer_name],
        column = 'dist_'+type+'_cat',
        cmap = 'Reds',
        tooltip = ['Quartier', 'dist_'+type],
        legend = False,
        legend_kwds = {'caption' : 'Distance'}
    )

    gdf_pav.loc[gdf_pav['Type de flux']==type].explore(
        m = layers[layer_name],
        marker_kwds=dict(radius=0.5, fill=True),
        color = 'Gray'
    )

    map.add_child(layers[layer_name])


# Contrôle de l'affichage des couches
GroupedLayerControl(
    groups={'Type de flux': [layer for layer in layers.values()]},
    collapsed=False,
).add_to(map)




map_title = "Distance moyenne au pav le plus proche par quartier"
title_html = f'<h1 align="center" style="font-size:24px" >{map_title}</h1>'
map.get_root().html.add_child(folium.Element(title_html))



map.save('../cartes/test.html')


  gdf_pav.loc[gdf_pav['Type de flux']==type].explore(
  gdf_pav.loc[gdf_pav['Type de flux']==type].explore(
