# Imports

In [1]:
import pandas as pd
import requests
import os
from urllib.parse import urlencode

# Testing Requests

In [7]:
API_KEY = os.environ.get("API_KEY")

In [11]:
data_type = "json"
params = {
    "address":"Decheterie de Monistrol sur Loire, les Cheminches, 43120",
    "key":API_KEY
}
url_params = urlencode(params)
endpoint = "https://maps.googleapis.com/maps/api/geocode/"
url = f"{endpoint}{data_type}?{url_params}"

r = requests.get(url)
r.json()

{'results': [{'address_components': [{'long_name': 'Les Cheminches',
     'short_name': 'Les Cheminches',
     'types': ['route']},
    {'long_name': 'Monistrol-sur-Loire',
     'short_name': 'Monistrol-sur-Loire',
     'types': ['locality', 'political']},
    {'long_name': 'Haute-Loire',
     'short_name': 'Haute-Loire',
     'types': ['administrative_area_level_2', 'political']},
    {'long_name': 'Auvergne-Rhône-Alpes',
     'short_name': 'Auvergne-Rhône-Alpes',
     'types': ['administrative_area_level_1', 'political']},
    {'long_name': 'France',
     'short_name': 'FR',
     'types': ['country', 'political']},
    {'long_name': '43120', 'short_name': '43120', 'types': ['postal_code']}],
   'formatted_address': 'Les Cheminches, 43120 Monistrol-sur-Loire, France',
   'geometry': {'bounds': {'northeast': {'lat': 45.2696404, 'lng': 4.18564},
     'southwest': {'lat': 45.2660179, 'lng': 4.183802}},
    'location': {'lat': 45.2678349, 'lng': 4.1846442},
    'location_type': 'GEOMETRIC

In [12]:
res = r.json()

In [13]:
res["results"][0]['geometry'].keys()

dict_keys(['bounds', 'location', 'location_type', 'viewport'])

In [14]:
res["results"][0]['geometry']["location"]

{'lat': 45.2678349, 'lng': 4.1846442}

In [15]:
res["results"][0]['formatted_address']

'Les Cheminches, 43120 Monistrol-sur-Loire, France'

# Loading and Cleaning Data

In [16]:
project_dir = os.path.dirname(os.path.os.path.abspath(""))
data_dir = os.path.join(project_dir, "data")
DATA_PATH  = os.path.join(data_dir, "AURA-liste-decheteries-des-collectivites-2020.xlsx")


In [18]:
df_raw = pd.read_excel(DATA_PATH, header=2,dtype={"Code postal":str}, )[:-3]
df_raw.head()

Unnamed: 0,Code du département,Année,Code SINOE,Nom,Date d'ouverture,Date de fermeture,Adresse,Adresse (suite),Code postal,Code commune,Libellé de la commune,Mode de gestion,Code MO,Nom MO,Code exploitant,Nom exploitant,Déchets des activités économiques acceptés,Déchets non dangereux des activités économiques,Déchets dangereux des activités économiques,Déchets amiantés
0,43.0,2020.0,38317.0,Decheterie de Monistrol sur Loire,01/01/2003,,les Cheminches,,43120,43137.0,Monistrol-sur-Loire,Régie,218.0,Sympttom Monistrol sur Loire,218.0,Sympttom Monistrol sur Loire,Oui (gratuit),Oui,Oui,Non
1,15.0,2020.0,38235.0,Decheterie de Pierrefort,01/01/2005,,Rue de Salzet,,15230,15152.0,Pierrefort,Régie,57489.0,Saint-flour Communauté,57489.0,Saint-flour Communauté,Oui (gratuit),Oui,Oui,Non
2,63.0,2020.0,8649.0,Decheterie de Pionsat,01/01/2004,,les Fayes,,63330,63281.0,Pionsat,Marché de prestation de service,1226.0,Sictom des Combrailles,1525.0,Sita Mos,Oui (payant),Oui,Oui,Non
3,15.0,2020.0,8252.0,Decheterie de Saint Flour,01/01/2005,,les Cramades,Zi de la Florizane,15100,15187.0,Saint-Flour,Régie,57489.0,Saint-flour Communauté,57489.0,Saint-flour Communauté,Oui (payant),Oui,Oui,Non
4,63.0,2020.0,2064.0,Decheterie de Saint Gervais d'Auvergne,14/06/2003,,Saint-Gervais-D'Auvergne,,63390,63354.0,Saint-Gervais-d'Auvergne,Marché de prestation de service,1226.0,Sictom des Combrailles,1525.0,Sita Mos,Oui (payant),Oui,Oui,Non


In [19]:
trash_cols = [
    "Déchets non dangereux des activités économiques",
    "Déchets dangereux des activités économiques",
    "Déchets amiantés"]

df_info_trash = df_raw[trash_cols]
df_info_trash.head()

Unnamed: 0,Déchets non dangereux des activités économiques,Déchets dangereux des activités économiques,Déchets amiantés
0,Oui,Oui,Non
1,Oui,Oui,Non
2,Oui,Oui,Non
3,Oui,Oui,Non
4,Oui,Oui,Non


In [20]:
df_info_trash.shape

(585, 3)

In [21]:
df_info_trash.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 585 entries, 0 to 584
Data columns (total 3 columns):
 #   Column                                           Non-Null Count  Dtype 
---  ------                                           --------------  ----- 
 0   Déchets non dangereux des activités économiques  304 non-null    object
 1   Déchets dangereux des activités économiques      304 non-null    object
 2   Déchets amiantés                                 318 non-null    object
dtypes: object(3)
memory usage: 13.8+ KB


In [22]:
for col in trash_cols:
    print(col,":",df_info_trash[col].unique())

Déchets non dangereux des activités économiques : ['Oui' nan]
Déchets dangereux des activités économiques : ['Oui' nan]
Déchets amiantés : ['Non' nan 'Oui']


In [15]:
df_info_trash = df_info_trash.fillna(False)
df_info_trash.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 585 entries, 0 to 584
Data columns (total 3 columns):
 #   Column                                           Non-Null Count  Dtype 
---  ------                                           --------------  ----- 
 0   Déchets non dangereux des activités économiques  585 non-null    object
 1   Déchets dangereux des activités économiques      585 non-null    object
 2   Déchets amiantés                                 585 non-null    object
dtypes: object(3)
memory usage: 13.8+ KB


In [18]:
df_info_trash.replace({'Oui':True, 'Non':False}, inplace=True)

In [19]:
df_info_trash.rename(columns = {
    'Déchets non dangereux des activités économiques':'non_dangereux', 
    'Déchets dangereux des activités économiques':'dangereux',
    "Déchets amiantés":"amiantes"
    }, inplace = True)


In [21]:
cond = df_info_trash[~df_info_trash.non_dangereux & ~df_info_trash.dangereux & ~df_info_trash.amiantes]
index_to_be_removed = cond.index

In [43]:
df_info_trash = df_info_trash.drop(index_to_be_removed)

In [22]:
cols = ["Nom", "Adresse","Adresse (suite)", "Libellé de la commune", "Code postal"]

In [23]:
df_address = df_raw[cols]
df_address = df_address.fillna("")
df_address["address_raw"] = df_address["Nom"]+" "+df_address["Adresse"]+" "+df_address["Adresse (suite)"]\
                            +" "+df_address["Libellé de la commune"]+" "+df_address["Code postal"]
df_address.head()

Unnamed: 0,Nom,Adresse,Adresse (suite),Libellé de la commune,Code postal,address_raw
0,Decheterie de Monistrol sur Loire,les Cheminches,,Monistrol-sur-Loire,43120,Decheterie de Monistrol sur Loire les Cheminch...
1,Decheterie de Pierrefort,Rue de Salzet,,Pierrefort,15230,Decheterie de Pierrefort Rue de Salzet Pierre...
2,Decheterie de Pionsat,les Fayes,,Pionsat,63330,Decheterie de Pionsat les Fayes Pionsat 63330
3,Decheterie de Saint Flour,les Cramades,Zi de la Florizane,Saint-Flour,15100,Decheterie de Saint Flour les Cramades Zi de l...
4,Decheterie de Saint Gervais d'Auvergne,Saint-Gervais-D'Auvergne,,Saint-Gervais-d'Auvergne,63390,Decheterie de Saint Gervais d'Auvergne Saint-G...


In [24]:
df_address = df_address.drop(index_to_be_removed)

In [25]:
print(df_address["address_raw"][0])

Decheterie de Monistrol sur Loire les Cheminches  Monistrol-sur-Loire 43120


In [4]:
from trashlocation import TrashLocation

API_KEY = os.environ.get("API_KEY")

local = TrashLocation()
local.API_KEY = API_KEY
address = "Decheterie de Monistrol sur Loire les Cheminches  Monistrol-sur-Loire 43120"
print(local.get_lat_lng(address=address))
print(local.get_formatted_address(address=address))

{'lat': 45.2678349, 'lng': 4.1846442}
Les Cheminches, 43120 Monistrol-sur-Loire, France


In [None]:
df_address["lat_lng"] = df_address["address_raw"].apply(local.get_lat_lng)

In [None]:
df_address["formatted_address"] = df_address["address_raw"].apply(local.get_formatted_address)

In [36]:
df_address["lat"] = df_address["lat_lng"].apply(lambda x:x["lat"])
df_address["lng"] = df_address["lat_lng"].apply(lambda x:x["lng"])

In [40]:
df_address = df_address.drop(columns=["lat_lng"], axis = 1)

In [41]:
df_address.head()

Unnamed: 0,Nom,Adresse,Adresse (suite),Libellé de la commune,Code postal,address_raw,formatted_address,lat,lng
0,Decheterie de Monistrol sur Loire,les Cheminches,,Monistrol-sur-Loire,43120,Decheterie de Monistrol sur Loire les Cheminch...,"Les Cheminches, 43120 Monistrol-sur-Loire, France",45.267835,4.184644
1,Decheterie de Pierrefort,Rue de Salzet,,Pierrefort,15230,Decheterie de Pierrefort Rue de Salzet Pierre...,"Rue de Salzet, 15230 Pierrefort, France",44.922413,2.83871
2,Decheterie de Pionsat,les Fayes,,Pionsat,63330,Decheterie de Pionsat les Fayes Pionsat 63330,"Les Fayes, 63330 Pionsat, France",46.108807,2.700687
3,Decheterie de Saint Flour,les Cramades,Zi de la Florizane,Saint-Flour,15100,Decheterie de Saint Flour les Cramades Zi de l...,"Zone Industrielle la Florizane & Les Cramades,...",45.049331,3.100755
4,Decheterie de Saint Gervais d'Auvergne,Saint-Gervais-D'Auvergne,,Saint-Gervais-d'Auvergne,63390,Decheterie de Saint Gervais d'Auvergne Saint-G...,"63390 Saint-Gervais-d'Auvergne, France",46.029527,2.821046


In [45]:
df_final = pd.concat([df_address, df_info_trash], axis = 1)

In [49]:
df_final = df_final.drop(columns=["Adresse", "Adresse (suite)", "Libellé de la commune", "Code postal"])

In [53]:
df_final.head()

Unnamed: 0,Nom,address_raw,formatted_address,lat,lng,non_dangereux,dangereux,amiantes
0,Decheterie de Monistrol sur Loire,Decheterie de Monistrol sur Loire les Cheminch...,"Les Cheminches, 43120 Monistrol-sur-Loire, France",45.267835,4.184644,True,True,False
1,Decheterie de Pierrefort,Decheterie de Pierrefort Rue de Salzet Pierre...,"Rue de Salzet, 15230 Pierrefort, France",44.922413,2.83871,True,True,False
2,Decheterie de Pionsat,Decheterie de Pionsat les Fayes Pionsat 63330,"Les Fayes, 63330 Pionsat, France",46.108807,2.700687,True,True,False
3,Decheterie de Saint Flour,Decheterie de Saint Flour les Cramades Zi de l...,"Zone Industrielle la Florizane & Les Cramades,...",45.049331,3.100755,True,True,False
4,Decheterie de Saint Gervais d'Auvergne,Decheterie de Saint Gervais d'Auvergne Saint-G...,"63390 Saint-Gervais-d'Auvergne, France",46.029527,2.821046,True,True,False


In [50]:
df_final.to_csv("formatted_data.csv", index=False)

In [33]:
from trashlocation import TrashLocation
import pandas as pd
pd.options.mode.chained_assignment = None 
root_path = os.path.dirname(os.path.abspath(""))
API_KEY = os.environ.get("API_KEY")
a = TrashLocation(root_path=root_path)
a.API_KEY = API_KEY
a.get_data_path("formatted_data.csv")
df_n_nearest = a.get_n_nearest(address="residence hector berlioz saint martin d'heres", n=4, trash_type="amiantes")

df_n_nearest

Unnamed: 0,Nom,formatted_address,dist
249,Déchèterie Vaulnaveys-le-haut,"D5E, 38410 Vaulnaveys-le-Haut, France",6.765365
205,Déchèterie Saint-egreve,"45 Rue du Pont Noir, 38120 Saint-Egrève, France",8.350308
257,Déchèterie Vif,"Av. de la Gare, 38450 Vif, France",14.189278
107,Déchèterie Livet-et-Gavet,"38220 Livet-et-Gavet, France",15.493777


In [34]:
df_n_nearest.reset_index(inplace=True,drop=True)

In [39]:
print(df_n_nearest.to_dict())

{'Nom': {0: 'Déchèterie\xa0Vaulnaveys-le-haut', 1: 'Déchèterie\xa0Saint-egreve', 2: 'Déchèterie\xa0Vif', 3: 'Déchèterie\xa0Livet-et-Gavet'}, 'formatted_address': {0: 'D5E, 38410 Vaulnaveys-le-Haut, France', 1: '45 Rue du Pont Noir, 38120 Saint-Egrève, France', 2: 'Av. de la Gare, 38450 Vif, France', 3: '38220 Livet-et-Gavet, France'}, 'dist': {0: 6.7653652888598765, 1: 8.350308378325302, 2: 14.189277676143329, 3: 15.493777380459537}}
