In [53]:
### GEOCODE DATAFRAME WITH GEOPY
# cf : https://geopy.readthedocs.io/en/stable/#installation
# cf : https://wiki.openstreetmap.org/wiki/Nominatim
# cf : http://blog.adrienvh.fr/2015/01/18/geocoder-en-masse-plusieurs-milliers-dadresses-avec-python-et-nominatim/

from time import sleep

import pprint
pp = pprint.PrettyPrinter(indent=2)

import pandas as pd

# cf : https://github.com/jmcarpenter2/swifter
# cf : https://medium.com/@jmcarpenter2/swiftapply-automatically-efficient-pandas-apply-operations-50e1058909f9
import swifter

from geopy.geocoders import Nominatim, BANFrance
from geopy.extra.rate_limiter import RateLimiter

from functools import partial
from tqdm import tqdm

In [54]:
tqdm.pandas()

**GENERIC VARIABLES**

In [55]:
dft_delay        = 1.5
dft_timeout      = 20
exact_one_dft    = True
full_address_col = "_full_address_"
location_col     = "_location_"

**GENERIC FUNCTIONS**

In [56]:
geocoder_nom = Nominatim(user_agent="_solidata_app_")
geocoder_ban = BANFrance(user_agent="_solidata_app_")

In [57]:
### rate limiter
geocode_nom = RateLimiter(geocoder_nom.geocode, min_delay_seconds=dft_delay)
geocode_ban = RateLimiter(geocoder_ban.geocode, min_delay_seconds=dft_delay)

In [58]:
def LocToDict(location) : 
    if location != None : 
        return {
            "raw"       : location.raw,
            "address"   : location.address,
            "point"     : location.point,
            "latitude"  : location.latitude,
            "longitude" : location.longitude,
        }
    else : 
        return {
            "raw"        : None,
            "address"    : None,
            "point"      : None,
            "latitude"   : None,
            "longitude"  : None,
        }

In [59]:
### concat function
def concat_cols(row, columns_to_concat):
    if len(columns_to_concat) > 1 :
        return ", ".join( row[col] for col in columns_to_concat )
    else : 
        return row[columns_to_concat[0]]

In [60]:
### main geolocalizing function for dataframe
def geoloc_df( row, col_name, complement, time_out, delay ) : 

    print ("\n- row[col_name] : ", row[col_name])

    adress = ", ".join( [row[col_name], complement ] )
    print ("- adress : ", adress)
    
    try :
        location = geocoder_nom.geocode( query=adress, timeout=time_out, extratags=True)
    except : 
        location = geocoder_ban.geocode( query=adress, timeout=time_out)
        
    print ("- location : ", location)
    
    sleep(delay)
    
    if location : 
        return LocToDict(location)
    else : 
        return None
    

In [62]:
### main geolocalizing function for dataframe
def geoloc_df_col( 
    row_val, 
    complement="", 
    time_out=dft_timeout, 
    delay=dft_delay,
    exact_one=exact_one_dft
    ) : 

    print ("\n- row_val : ", row_val)
    
    if pd.notnull(row_val) : 
        
        adress = ", ".join( [ row_val, complement ] )
        print ("- adress : ", adress)

        try :
            location = geocoder_nom.geocode( query=adress, exactly_one=exact_one, timeout=time_out, extratags=True)
        except : 
            location = geocoder_ban.geocode( query=adress, exactly_one=exact_one, timeout=time_out)

        print ("- location : ", location)

        sleep(delay)

        if location : 
            return LocToDict(location)
        
        else : 
            return None
    
    else : 
        return None

**test with simple address**

In [63]:
### variables to geocode

adresse_01 = "191 rue Saint-Jacques, Paris, France"
adresse_02 = "ABERGEMENT CLEMENCIAT, 01001"

adress_complement = "France"

In [64]:
location_01 = geocoder_nom.geocode(query=adresse_01, timeout=dft_timeout, extratags=True)
print(location_01)

Institut de Géographie, 191, Rue Saint-Jacques, Val-de-Grâce, 5e, Paris, Île-de-France, France métropolitaine, 75005, France


In [65]:
location_01_dict = LocToDict(location_01)
pp.pprint(location_01_dict)

{ 'address': 'Institut de Géographie, 191, Rue Saint-Jacques, Val-de-Grâce, '
             '5e, Paris, Île-de-France, France métropolitaine, 75005, France',
  'latitude': 48.84468875,
  'longitude': 2.34258870005006,
  'point': Point(48.84468875, 2.34258870005006, 0.0),
  'raw': { 'boundingbox': [ '48.8445388',
                            '48.8448244',
                            '2.3423236',
                            '2.3428539'],
           'class': 'amenity',
           'display_name': 'Institut de Géographie, 191, Rue Saint-Jacques, '
                           'Val-de-Grâce, 5e, Paris, Île-de-France, France '
                           'métropolitaine, 75005, France',
           'extratags': { 'internet_access': 'no',
                          'wikidata': 'Q3152006',
                          'wikipedia': 'fr:Institut de géographie'},
           'icon': 'https://nominatim.openstreetmap.org/images/mapicons/education_university.p.20.png',
           'importance': 0.827646119222430

In [66]:
location_02a = geocoder_nom.geocode(adresse_02, True, dft_timeout)
print(location_02a)

None


In [67]:
location_02b = geocoder_ban.geocode(adresse_02, timeout=dft_timeout)
print((location_02b.latitude, location_02b.longitude))

(46.150598, 4.920347)


In [68]:
location_02_dict = LocToDict(location_02b)
pp.pprint(location_02_dict)

{ 'address': "L'Abergement-Clémenciat",
  'latitude': 46.150598,
  'longitude': 4.920347,
  'point': Point(46.150598, 4.920347, 0.0),
  'raw': { 'geometry': {'coordinates': [4.920347, 46.150598], 'type': 'Point'},
           'properties': { 'adm_weight': 1,
                           'city': "L'Abergement-Clémenciat",
                           'citycode': '01001',
                           'context': '01, Ain, Auvergne-Rhône-Alpes '
                                      '(Rhône-Alpes)',
                           'id': '01001',
                           'importance': 0.075,
                           'label': "L'Abergement-Clémenciat",
                           'name': "L'Abergement-Clémenciat",
                           'population': 0.8,
                           'postcode': '01400',
                           'score': 0.6613636363636364,
                           'type': 'municipality',
                           'x': 848200,
                           'y': 6563000},
        

**test with pandas**

In [69]:
csv_test_01 = "tests_jupyter/2016_codes_postaux_prep.csv"
csv_test_02 = "tests_jupyter/export_openscraper_5aa3de630a828651b2ebfe3e.csv"

In [70]:
df_01 = pd.read_csv(csv_test_01, encoding="utf8")
df_01.head(3)

Unnamed: 0,Code_commune_INSEE,Nom_commune,Code_postal,Libelle_acheminement,Ligne_5,latitude,longitude,Population,Surface,geopoint_2d
0,1001,L ABERGEMENT CLEMENCIAT,1400,L ABERGEMENT CLEMENCIAT,,46.156818,4.924707,767.0,1567.0,POINT(4.924707496412453 46.15681799286022)
1,1002,L ABERGEMENT DE VAREY,1640,L ABERGEMENT DE VAREY,,46.010085,5.428759,236.0,909.0,POINT(5.428759087785754 46.01008524345922)
2,1004,AMBERIEU EN BUGEY,1500,AMBERIEU EN BUGEY,,45.9584,5.375901,14359.0,2449.0,POINT(5.375901233977878 45.958399862151865)


In [71]:
df_02 = pd.read_csv(csv_test_02, sep="|", encoding="utf8")
df_02.head(3)

Unnamed: 0,spider_name,link_src,link_data,fiche contact,date du projet,partenaires du projet,données économiques,résumé du projet,tags,website,auteur,logo,adresse du projet,titre du projet,image(s) du projet,structure porteuse,SIRET,statut juridique,récompenses,video
0,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,82 avenue Jean Jaurès Directrice du pole Mail:...,• APAJH • Association Charles de Foucauld Cons...,"Afin d’améliorer l’accueil, de plus en plus fr...","Gouvernance, partenariats institutionnels Vie ...",mailto:gwenola.toutain@croix-rouge.fr,Bourgogne,Accompagnement à la parentalité : des acteurs ...,http://www.apriles.net/images/stories/Centrepa...,Centre parental de Migennes - Croix Rouge fran...,,,,,,,,
1,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Lien internet: Mail: 72 Rue Président Wilson 4...,- Proposer des fruits et légumes frais de sais...,«Relocaliser la production agricole a des impa...,"Gouvernance, partenariats institutionnels Jeun...",http://www.grandcahors.fr mailto:dpennequin@gr...,Midi-Pyrénées,La légumerie : première pierre du Projet alime...,http://www.apriles.net/images/stories/Le%CC%81...,Communauté d'agglomération du Grand Cahors,,,,,,,,
2,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,"Lien internet: 44100 Nantes Directrice, Pôle é...","Etat (aides à la pierre), Région Pays-de-la-Lo...",Afin de répondre aux besoins d’hébergement de ...,"Petite enfance, modes de garde Parentalité Rel...",mailto:Catherine.bouget@croix-rouge.fr http://...,Pays de la Loire,"Au Bois Bouchaud, parents, enfants et seniors ...",http://www.apriles.net/images/stories/Boisbouc...,Croix Rouge française,,,,,,,,


In [72]:
df_01.columns

Index(['Code_commune_INSEE', 'Nom_commune', 'Code_postal',
       'Libelle_acheminement', 'Ligne_5', 'latitude', 'longitude',
       'Population', 'Surface', 'geopoint_2d'],
      dtype='object')

In [80]:
df_02.columns

Index(['spider_name', 'link_src', 'link_data', 'fiche contact',
       'date du projet', 'partenaires du projet', 'données économiques',
       'résumé du projet', 'tags', 'website', 'auteur', 'logo',
       'adresse du projet', 'titre du projet', 'image(s) du projet',
       'structure porteuse', 'SIRET', 'statut juridique', 'récompenses',
       'video'],
      dtype='object')

In [88]:
### list of meaningfull columns for geoloc
address_columns_01 = ["Nom_commune", "Code_commune_INSEE"]
address_columns_02 = [ "adresse du projet", "tags"]

In [89]:
addresses = df_01["Nom_commune"].tolist()
print (addresses[:5], "...")

['L ABERGEMENT CLEMENCIAT', 'L ABERGEMENT DE VAREY', 'AMBERIEU EN BUGEY', 'AMBERIEUX EN DOMBES', 'AMBLEON'] ...


In [90]:
### apply concat function to each row (axis=1)
df_01[full_address_col] = df_01.apply(concat_cols, args=[address_columns_01], axis=1)
df_01.head(3)

Unnamed: 0,Code_commune_INSEE,Nom_commune,Code_postal,Libelle_acheminement,Ligne_5,latitude,longitude,Population,Surface,geopoint_2d,_full_address_
0,1001,L ABERGEMENT CLEMENCIAT,1400,L ABERGEMENT CLEMENCIAT,,46.156818,4.924707,767.0,1567.0,POINT(4.924707496412453 46.15681799286022),"L ABERGEMENT CLEMENCIAT, 01001"
1,1002,L ABERGEMENT DE VAREY,1640,L ABERGEMENT DE VAREY,,46.010085,5.428759,236.0,909.0,POINT(5.428759087785754 46.01008524345922),"L ABERGEMENT DE VAREY, 01002"
2,1004,AMBERIEU EN BUGEY,1500,AMBERIEU EN BUGEY,,45.9584,5.375901,14359.0,2449.0,POINT(5.375901233977878 45.958399862151865),"AMBERIEU EN BUGEY, 01004"


In [91]:
df_01.shape

(39201, 11)

In [94]:
### apply concat function to each row (axis=1)
# df_02[full_address_col] = df_02.apply(concat_cols, args=[address_columns_02], axis=1)
df_02[full_address_col] = df_02[address_columns_02].apply( lambda x : ', '.join(x.astype(str)), axis=1 )
df_02.sample(10)

Unnamed: 0,spider_name,link_src,link_data,fiche contact,date du projet,partenaires du projet,données économiques,résumé du projet,tags,website,...,logo,adresse du projet,titre du projet,image(s) du projet,structure porteuse,SIRET,statut juridique,récompenses,video,_full_address_
91,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Lien internet: Mail: Association la Main verte...,Education nationale Msa d'Alsace Adapei du Bas...,un guide très complet d’une cinquantaine de pa...,"Accessibilité, Mobilité Emploi, Formation Déve...",mailto:main-verte@wanadoo.fr http://entreprise...,Alsace,La main verte creuse son sillon,...,Association de droit local La Main Verte,,,,,,,,,"nan, Alsace"
4,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Lien internet: Mail: 194 Avenue Rubillard Cent...,"Société Mécapack, don de barquettes à usage un...",Le fonctionnement actuel mobilise uniquement d...,Pour lutter contre le gaspillage et favoriser ...,Vie en établissement Intégration Lutte contre ...,http://www.ch-lemans.fr mailto:juteau@free.fr,Pays de la Loire,...,http://www.apriles.net/images/stories/CHMans1.JPG,Centre hospitalier du Mans,,,,,,,,"Centre hospitalier du Mans, http://www.ch-lema..."
6,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Lien internet: Adjoint au maire Ville de Mouan...,Pas de partenariat pour la régie agricole.,Financiers : Un domaine d’une surface utile de...,Afin de promouvoir une alimentation saine et é...,"Emploi, Formation Développement local rural Go...",mailto:gilles.perole@mouans-sartoux.net http:/...,Provence-Alpes-Côte d'Azur,...,http://www.apriles.net/images/stories/Mouans-S...,Ville de Mouans-Sartoux,,,,,,,,"Ville de Mouans-Sartoux, mailto:gilles.perole@..."
165,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Mail: Tel: 01 40 03 77 76 Lien internet: Direc...,L'Association de Prévention du Site de la Vill...,Pour favoriser l'accès à la musique classique ...,"Jeunesse Education Loisirs, Vacances Culture, ...",http://www.orchestredemos.fr/ mailto:oflament@...,Île-de-France,Demos : les bienfaits de la musique classique ...,...,Association de Prévention du Site de la Villet...,,,,,,,,,"nan, Île-de-France"
181,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Mail: Conseil général de l’Allier Tel: 04 70 3...,"- les accueillants familiaux, - les hôpitaux s...",Constatant le manque de places dans les struct...,"Vie des séniors Soutien aux aidants Logement, ...",mailto:chauvin.ca@cg03.fr,Auvergne,L'accueil familial : plus qu'une alternative à...,...,,,,,,,,,,"nan, Auvergne"
28,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Lien internet: Chargé de mission au Pôle dével...,APER de Saultain ; Association C-culturel ; As...,"En dehors des manifestations publiques, aucun ...",Afin de faire évoluer les pratiques et les act...,"Gouvernance, partenariats institutionnels Jeun...",mailto:eric-boutelier@staj.asso.fr http://www....,Nord-Pas-de-Calais,...,http://www.apriles.net/images/stories/RIJV2.png,Association Service Technique pour les Activit...,,,,,,,,Association Service Technique pour les Activit...
37,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,"éducatrice 78, rue du Colonel Fabien Lien inte...","Les parents Education nationale, écoles, RASED...",Afin de favoriser autant que possible le maint...,Participation des habitants Intégration Parent...,http://www.sauvegarde42.fr mailto:machizaud@sa...,Rhône-Alpes,Machizaud : un accueil de jour avec les familles,...,Association Sauvegarde 42,,,,,,,,,"nan, Rhône-Alpes"
145,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Lien internet: Autisme Espoir Vers l'Ecole Mai...,L'association est financée par des mécènes pri...,Pour permettre à des enfants autistes âgés de ...,Intégration Soutien aux aidants Lutte contre l...,mailto:contact@autisme-espoir.org http://www.a...,-France entière,Autisme Espoir Vers l'Ecole : accompagner des ...,...,Association Autisme Espoir vers l'Ecole (AEVE).,,,,,,,,,"nan, -France entière"
164,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Mail: Tel: 02.40.41.98.54 Responsable animatio...,15 associations locales gestionnaires,"Afin de favoriser la mixité sociale, la créati...","Développement urbain, Vie des quartiers Relati...",mailto:marie-france.ringeard@mairie-nantes.fr,Pays de la Loire,"A Nantes, des jardins familiaux qui aèrent la ...",...,Mairie de Nantes,,,,,,,,,"nan, Pays de la Loire"
18,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Lien internet: Mail: Tel: 02 40 20 33 86 Prési...,-La CIFAM (Chambre de métiers et de l’artisana...,Afin de contribuer à changer le regard de la s...,"Accessibilité, Mobilité Emploi, Formation Inté...",http://projet-lereflet.fr/ mailto:comlereflet@...,Pays de la Loire,"Le Reflet, un restaurant ordinaire pour travai...",...,Association Trinôme 44,,,,,,,,,"nan, Pays de la Loire"


In [79]:
df_02.shape

(269, 20)

In [28]:
### MAIN GEOCODING FUNCTION ON DF + SWIFTER

df_02[location_col] = df_02[full_address_col].swifter.apply( 
    geoloc_df_col, 
    complement=adress_complement, 
    time_out=dft_timeout, 
    delay=dft_delay, 
)


- row_val :  0                                                   NaN
1                                                   NaN
2                                                   NaN
3                                                   NaN
4                            Centre hospitalier du Mans
5                            Coopérer pour entreprendre
6                               Ville de Mouans-Sartoux
7     Centre de Ressources Politique de la Ville de ...
8                                     Ville de Bordeaux
9                                    ENVIE Autonomie 49
10                                  Association Viltaïs
11                            Ville de Clichy-sous-Bois
12                                        Ville d’Arras
13                                                  NaN
14                                        CCAS d’Angers
15                                                  NaN
Name: _full_address_, dtype: object

- row_val :  nan

- row_val :  nan

- row_val :  nan


- location :  Centre Hospitalier du Mans, Rue de Degré, Cité de l'Épine, Le Buisson, Le Mans, Sarthe, Pays de la Loire, France métropolitaine, 72000, France

- row_val :  Coopérer pour entreprendre
- adress :  Coopérer pour entreprendre, France
- location :  None

- row_val :  Ville de Mouans-Sartoux
- adress :  Ville de Mouans-Sartoux, France
- location :  None

- row_val :  Centre de Ressources Politique de la Ville de Guyane (Commissariat général à l’égalité des territoires – CGET)
- adress :  Centre de Ressources Politique de la Ville de Guyane (Commissariat général à l’égalité des territoires – CGET), France
- location :  None

- row_val :  Ville de Bordeaux
- adress :  Ville de Bordeaux, France
- location :  Base sous-marine de Bordeaux, Boulevard Alfred Daney, Bordeaux Maritime, Bordeaux, Gironde, Nouvelle-Aquitaine, France métropolitaine, 33000, France

- row_val :  ENVIE Autonomie 49
- adress :  ENVIE Autonomie 49, France
- location :  None

- row_val :  Association Viltaïs
- 


- row_val :  Coopérer pour entreprendre
- adress :  Coopérer pour entreprendre, France
- location :  None

- row_val :  Ville de Mouans-Sartoux
- adress :  Ville de Mouans-Sartoux, France
- location :  None

- row_val :  Centre de Ressources Politique de la Ville de Guyane (Commissariat général à l’égalité des territoires – CGET)
- adress :  Centre de Ressources Politique de la Ville de Guyane (Commissariat général à l’égalité des territoires – CGET), France
- location :  None

- row_val :  Ville de Bordeaux
- adress :  Ville de Bordeaux, France
- location :  Base sous-marine de Bordeaux, Boulevard Alfred Daney, Bordeaux Maritime, Bordeaux, Gironde, Nouvelle-Aquitaine, France métropolitaine, 33000, France

- row_val :  ENVIE Autonomie 49
- adress :  ENVIE Autonomie 49, France
- location :  None

- row_val :  Association Viltaïs
- adress :  Association Viltaïs, France
- location :  None

- row_val :  Ville de Clichy-sous-Bois
- adress :  Ville de Clichy-sous-Bois, France
- location :  

Pandas Apply:   0%|          | 0/269 [00:00<?, ?it/s]


- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val

Pandas Apply:   2%|▏         | 6/269 [00:01<01:11,  3.66it/s]


- row_val :  Coopérer pour entreprendre
- adress :  Coopérer pour entreprendre, France
- location :  None


Pandas Apply:   3%|▎         | 7/269 [00:03<02:57,  1.47it/s]


- row_val :  Ville de Mouans-Sartoux
- adress :  Ville de Mouans-Sartoux, France
- location :  None


Pandas Apply:   3%|▎         | 8/269 [00:04<04:16,  1.02it/s]


- row_val :  Centre de Ressources Politique de la Ville de Guyane (Commissariat général à l’égalité des territoires – CGET)
- adress :  Centre de Ressources Politique de la Ville de Guyane (Commissariat général à l’égalité des territoires – CGET), France
- location :  None


Pandas Apply:   3%|▎         | 9/269 [00:06<05:21,  1.24s/it]


- row_val :  Ville de Bordeaux
- adress :  Ville de Bordeaux, France
- location :  Base sous-marine de Bordeaux, Boulevard Alfred Daney, Bordeaux Maritime, Bordeaux, Gironde, Nouvelle-Aquitaine, France métropolitaine, 33000, France


Pandas Apply:   4%|▎         | 10/269 [00:08<05:54,  1.37s/it]


- row_val :  ENVIE Autonomie 49
- adress :  ENVIE Autonomie 49, France
- location :  None


Pandas Apply:   4%|▍         | 11/269 [00:10<06:20,  1.47s/it]


- row_val :  Association Viltaïs
- adress :  Association Viltaïs, France
- location :  None


Pandas Apply:   4%|▍         | 12/269 [00:11<06:34,  1.54s/it]


- row_val :  Ville de Clichy-sous-Bois
- adress :  Ville de Clichy-sous-Bois, France
- location :  None


Pandas Apply:   5%|▍         | 13/269 [00:13<06:51,  1.61s/it]


- row_val :  Ville d’Arras
- adress :  Ville d’Arras, France
- location :  Ville d'Arras, Rue Deroeux Rebout, Arras, Pas-de-Calais, Hauts-de-France, France métropolitaine, 62000, France


Pandas Apply:   5%|▌         | 14/269 [00:15<06:55,  1.63s/it]


- row_val :  nan

- row_val :  CCAS d’Angers
- adress :  CCAS d’Angers, France
- location :  None


Pandas Apply:   6%|▌         | 16/269 [00:17<05:54,  1.40s/it]


- row_val :  nan

- row_val :  Direction de la Cohésion Sociale de Valenciennes Métropole.
- adress :  Direction de la Cohésion Sociale de Valenciennes Métropole., France
- location :  None


Pandas Apply:   7%|▋         | 18/269 [00:18<05:10,  1.24s/it]


- row_val :  Ville du Havre
- adress :  Ville du Havre, France
- location :  Médiathèque de Caucriauville, 40, Rue Jules Vallès, Caucriauville, Le Havre, Seine-Maritime, Normandie, France métropolitaine, 76610, France


Pandas Apply:   7%|▋         | 19/269 [00:20<05:41,  1.36s/it]


- row_val :  nan

- row_val :  Conseil départemental de Loire-Atlantique
- adress :  Conseil départemental de Loire-Atlantique, France
- location :  Conseil départemental de Loire-Atlantique, 3, Quai Ceineray, Decré - Cathédrale, Centre Ville, Nantes, Loire-Atlantique, Pays de la Loire, France métropolitaine, 44000, France


Pandas Apply:   8%|▊         | 21/269 [00:22<04:58,  1.20s/it]


- row_val :  Association ISRAA (Innover Sensibiliser Réagir pour l’Avenir des personnes Autistes)
- adress :  Association ISRAA (Innover Sensibiliser Réagir pour l’Avenir des personnes Autistes), France
- location :  None


Pandas Apply:   8%|▊         | 22/269 [00:23<05:32,  1.35s/it]


- row_val :  Ligue de l’enseignement de l’Oise en étroite collaboration avec la commune de Bailleul-sur-Thérain.
- adress :  Ligue de l’enseignement de l’Oise en étroite collaboration avec la commune de Bailleul-sur-Thérain., France
- location :  None


Pandas Apply:   9%|▊         | 23/269 [00:25<06:13,  1.52s/it]


- row_val :  Eurométropole de Strasbourg
- adress :  Eurométropole de Strasbourg, France
- location :  Médiathèque André Malraux, Presqu'Île André Malraux, La Petite France, Esplanade, Strasbourg, Bas-Rhin, Grand Est, France métropolitaine, 67100, France


Pandas Apply:   9%|▉         | 24/269 [00:27<06:21,  1.56s/it]


- row_val :  Association Traces-Les Atomes crochus
- adress :  Association Traces-Les Atomes crochus, France
- location :  None


Pandas Apply:   9%|▉         | 25/269 [00:29<06:30,  1.60s/it]


- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  Association Service Technique pour les Activités de Jeunesse (STAJ) Nord-Artois
- adress :  Association Service Technique pour les Activités de Jeunesse (STAJ) Nord-Artois, France
- location :  None


Pandas Apply:  11%|█         | 30/269 [00:30<04:51,  1.22s/it]


- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  Mission locale du Pays de Cornouaille
- adress :  Mission locale du Pays de Cornouaille, France
- location :  Mission locale du Pays de Cornouaille, 4, Place Louis Armand, Saint-Laurent, Leurguéric, Quimper, Finistère, Bretagne, France métropolitaine, 29000, France


Pandas Apply:  19%|█▉        | 52/269 [00:32<03:10,  1.14it/s]


- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  Association Médiation nomade
- adress :  Association Médiation nomade, France
- location :  None


Pandas Apply:  22%|██▏       | 58/269 [00:34<02:27,  1.43it/s]


- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  Association La Case
- adress :  Association La Case, France
- location :  None


Pandas Apply:  23%|██▎       | 62/269 [00:35<02:08,  1.61it/s]


- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  Conseil général du Val de Marne
- adress :  Conseil général du Val de Marne, France
- location :  Robert Desnos, Rue du Docteur Calmette, Port d'Orly, Orly, Arrondissement de L'Haÿ-les-Roses, Val-de-Marne, Île-de-France, France métropolitaine, 94310, France


Pandas Apply:  32%|███▏      | 85/269 [00:37<01:24,  2.18it/s]


- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val

Pandas Apply:  53%|█████▎    | 143/269 [00:39<00:41,  3.03it/s]


- row_val :  nan

- row_val :  Association Les Amis du Zeybu
- adress :  Association Les Amis du Zeybu, France
- location :  None


Pandas Apply:  54%|█████▍    | 145/269 [00:40<00:58,  2.10it/s]


- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  Association Energies et jardins du c'ur
- adress :  Association Energies et jardins du c'ur, France
- location :  None


Pandas Apply:  56%|█████▌    | 151/269 [00:42<00:49,  2.39it/s]


- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  Association la Source
- adress :  Association la Source, France
- location :  Association Pêcheurs Libres, Quai des Anglais, La Source, Saint-Pierre, Martigues, Istres, Bouches-du-Rhône, Provence-Alpes-Côte d'Azur, France métropolitaine, 13500, France


Pandas Apply: 100%|██████████| 269/269 [00:44<00:00,  6.06it/s]


- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val :  nan

- row_val




In [32]:
df_02.sample(10)

Unnamed: 0,spider_name,link_src,link_data,fiche contact,date du projet,partenaires du projet,données économiques,résumé du projet,tags,website,...,adresse du projet,titre du projet,image(s) du projet,structure porteuse,SIRET,statut juridique,récompenses,video,_full_address_,_location_
263,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,"Lien internet: 28, rue Or Mail: 68500 BERRWILL...",via Apriles accompagne l’essaimage et la promo...,"Le principe : chaque année durant une journée,...",Rénovation urbaine Participation des habitants...,mailto:jordan.fabian@cegetel.net http://journe...,-France entière,La Journée Citoyenne : faire ensemble pour mie...,...,,,,,,,,,,
99,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Lien internet: Mail: Directrice du Foyer Tel: ...,la Région de Bruxelles a donné une prime de ré...,Afin de lutter contre la défiance envers les p...,Vie des séniors Relations de voisinage Partici...,mailto:loredana.marchi@foyer.be http://www.foy...,-Etranger,Deux cultures et trois générations sous le mêm...,...,,,,,,,,,,
71,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Lien internet: 29000 Quimper Mail: Adepape du ...,Le Conseil départemental du Finistère est le c...,Afin d’assurer un accompagnement de qualité au...,"Gouvernance, partenariats institutionnels Empl...",mailto:adepape29@wanadoo.fr http://www.adepape...,Bretagne,"Protection de l'enfance : Le parrainage, une r...",...,,,,,,,,,,
206,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Conseil général de l'Isère Grenoble et son agg...,Pour susciter liens et relations de voisinage ...,Participation des habitants Lutte contre l'exc...,Rhône-Alpes,Le Secours catholique fait Cause commune à Gre...,http://www.apriles.net/images/stories/Cause%20...,Secours catholique,...,,,,,,,,,,
167,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,directeur Mail: 35 avenue Victor Hugo L'ancien...,Partenariats fonctionnels avec l'association g...,Afin de favoriser la rencontre et l'enrichisse...,Vie en établissement Participation des habitan...,mailto:thomas@lanciencarmel.com,Midi-Pyrénées,"Dans l'ancien Carmel de Condom, le tourisme ri...",...,,,,,,,,,,
181,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Mail: Conseil général de l’Allier Tel: 04 70 3...,"- les accueillants familiaux, - les hôpitaux s...",Constatant le manque de places dans les struct...,"Vie des séniors Soutien aux aidants Logement, ...",mailto:chauvin.ca@cg03.fr,Auvergne,L'accueil familial : plus qu'une alternative à...,...,,,,,,,,,,
31,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Vice-Président Compétences Lien internet: Tel:...,"Caisse des dépôts et consignations, Centre d’i...",Afin de mieux vivre leur passage à la retraite...,"Vie des séniors Emploi, Formation Bénévolat Je...",mailto:etienne.hoepffner.ecti@gmail.com http:/...,-France entière,ECTI : le bénévolat de compétences donne de l’...,...,,,,,,,,,,
48,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Lien internet: CH-1707 Fribourg Association Ed...,"Fondations, 6 en 2015 Communes, dont Fribourg ...",Afin de renforcer les compétences des familles...,"Gouvernance, partenariats institutionnels Part...",mailto:contact@educationfamiliale.ch http://ww...,-Etranger,Les permanences éducatives suisses : accompagn...,...,,,,,,,,,,
200,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Conseil général du Pas-de-Calais Mail: Tel: 03...,Conseil général du Pas-de-Calais ; 43 établiss...,Pour soutenir le plus efficacement possible le...,"Emploi, Formation Développement local rural Dé...",mailto:demol.arnaud@cg62.fr,Nord-Pas-de-Calais,Des contrats entre le Département du Pas-de-Ca...,...,,,,,,,,,,
142,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Lien internet: Tel: 03.83.55.00.00 54000 Nancy...,Collectif Santé Mentale de Lorraine Conseil dé...,Afin de lutter contre les nombreux préjugés qu...,Intégration Nouvelles pratiques professionnell...,mailto:pauline.simon@espoir54.org http://www.e...,Lorraine,Bibliothèque des livres vivants : quand les ma...,...,,,,,,,,,,


In [30]:
filtered_df = df_02[df_02[location_col].notnull()].copy()
filtered_df.sample(5)

Unnamed: 0,spider_name,link_src,link_data,fiche contact,date du projet,partenaires du projet,données économiques,résumé du projet,tags,website,...,adresse du projet,titre du projet,image(s) du projet,structure porteuse,SIRET,statut juridique,récompenses,video,_full_address_,_location_
12,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,"Lien internet: Mairie d'Arras, Place Guy Molle...",Les équipes pluridisciplinaires de quartier ra...,1. Le Projet de Développement Solidaire d’Arra...,Afin de renforcer l’interconnaissance et la co...,"Gouvernance, partenariats institutionnels Déve...",http://www.arras.fr mailto:a-konieczny@ville-a...,Nord-Pas-de-Calais,...,Ville d’Arras,,,,,,,,Ville d’Arras,"{'raw': {'place_id': '62247984', 'licence': 'D..."
19,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Lien internet: 3 Quai Ceineray Tel: 02 40 99 1...,Le dispositif est entièrement internalisé. Il ...,Financiers : Quatre travailleurs sociaux du Dé...,Afin d’apporter une solution d’accueil adaptée...,Protection de l'enfance Intégration Nouvelles ...,mailto:laurent.gollandeau@loire-atlantique.fr ...,Pays de la Loire,...,Conseil départemental de Loire-Atlantique,,,,,,,,Conseil départemental de Loire-Atlantique,"{'raw': {'place_id': '241565046', 'licence': '..."
83,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,"21-29, avenue du Général de Gaulle Conseil gén...","Conseil général du Val de Marne, ETAI, AFASER",Financiers : ________________________ 10.000 €...,Afin de développer la participation de tous le...,"Accessibilité, Mobilité Intégration Lutte cont...",http://www.valdemarne.fr mailto:sophie.largeau...,Île-de-France,...,Conseil général du Val de Marne,,,,,,,,Conseil général du Val de Marne,"{'raw': {'place_id': '189432783', 'licence': '..."
50,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Assistant de gestion Lien internet: 29000 Quim...,,>Consulter l'article du Journal des acteurs so...,Afin de permettre à de jeunes futurs conducteu...,"Vie des séniors Accessibilité, Mobilité Emploi...",mailto:gmorel@mlpc.asso.fr http://www.mlpc.ass...,Bretagne,...,Mission locale du Pays de Cornouaille,,,,,,,,Mission locale du Pays de Cornouaille,"{'raw': {'place_id': '61343231', 'licence': 'D..."
17,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Fabrique du quartier Danton – Ville du Havre L...,Sur la concertation menée sur le quartier Dant...,700 000 euros investis spécifiquement sur la c...,Afin de mettre les habitants au cœur du projet...,"Rénovation urbaine Développement urbain, Vie d...",mailto:benjamin.lebourg@lehavre.fr http://www....,Haute-Normandie,...,Ville du Havre,,,,,,,,Ville du Havre,"{'raw': {'place_id': '22957963', 'licence': 'D..."


In [31]:
def extract_loc(row, field_name="longitude") :
    # print(row)
    # print (type(row))
    return row[field_name]
    
filtered_df["raw"] = filtered_df[location_col].apply(extract_loc, field_name="raw")
filtered_df["lat"] = filtered_df[location_col].apply(extract_loc, field_name="latitude")
filtered_df["long"] = filtered_df[location_col].apply(extract_loc, field_name="longitude")
filtered_df["address"] = filtered_df[location_col].apply(extract_loc, field_name="address")
filtered_df.sample(5)

Unnamed: 0,spider_name,link_src,link_data,fiche contact,date du projet,partenaires du projet,données économiques,résumé du projet,tags,website,...,SIRET,statut juridique,récompenses,video,_full_address_,_location_,raw,lat,long,address
156,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Association la Source Lien internet: Mail: 3 r...,"En novembre 1994, la SCI des Amis de la Poulti...",___________________,>>Consulter la brochure des 20 ans de La Sourc...,Parentalité Lutte contre l'exclusion sociale P...,http://www.associationlasource.fr mailto:rober...,Haute-Normandie,...,,,,,Association la Source,"{'raw': {'place_id': '63721638', 'licence': 'D...","{'place_id': '63721638', 'licence': 'Data © Op...",43.404823,5.055001,"Association Pêcheurs Libres, Quai des Anglais,..."
19,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Lien internet: 3 Quai Ceineray Tel: 02 40 99 1...,Le dispositif est entièrement internalisé. Il ...,Financiers : Quatre travailleurs sociaux du Dé...,Afin d’apporter une solution d’accueil adaptée...,Protection de l'enfance Intégration Nouvelles ...,mailto:laurent.gollandeau@loire-atlantique.fr ...,Pays de la Loire,...,,,,,Conseil départemental de Loire-Atlantique,"{'raw': {'place_id': '241565046', 'licence': '...","{'place_id': '241565046', 'licence': 'Data © O...",47.22087,-1.552151,"Conseil départemental de Loire-Atlantique, 3, ..."
8,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Lien internet: chargée de mission handicap et ...,"Préfecture, Direction régionale et département...",• Un chargé de mission analyse des besoins soc...,Afin d’améliorer la coordination et l’interpré...,"Gouvernance, partenariats institutionnels Diag...",http://www.bordeaux.fr mailto:c.beaufort-lance...,Aquitaine,...,,,,,Ville de Bordeaux,"{'raw': {'place_id': '82004620', 'licence': 'D...","{'place_id': '82004620', 'licence': 'Data © Op...",44.870552,-0.558876,"Base sous-marine de Bordeaux, Boulevard Alfred..."
50,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,Assistant de gestion Lien internet: 29000 Quim...,,>Consulter l'article du Journal des acteurs so...,Afin de permettre à de jeunes futurs conducteu...,"Vie des séniors Accessibilité, Mobilité Emploi...",mailto:gmorel@mlpc.asso.fr http://www.mlpc.ass...,Bretagne,...,,,,,Mission locale du Pays de Cornouaille,"{'raw': {'place_id': '61343231', 'licence': 'D...","{'place_id': '61343231', 'licence': 'Data © Op...",47.994228,-4.091771,"Mission locale du Pays de Cornouaille, 4, Plac..."
12,Apriles,http://www.apriles.net/index.php?option=com_so...,http://www.apriles.net/index.php?option=com_so...,"Lien internet: Mairie d'Arras, Place Guy Molle...",Les équipes pluridisciplinaires de quartier ra...,1. Le Projet de Développement Solidaire d’Arra...,Afin de renforcer l’interconnaissance et la co...,"Gouvernance, partenariats institutionnels Déve...",http://www.arras.fr mailto:a-konieczny@ville-a...,Nord-Pas-de-Calais,...,,,,,Ville d’Arras,"{'raw': {'place_id': '62247984', 'licence': 'D...","{'place_id': '62247984', 'licence': 'Data © Op...",50.284776,2.789944,"Ville d'Arras, Rue Deroeux Rebout, Arras, Pas-..."


In [None]:
### cf : https://geopy.readthedocs.io/en/stable/#usage-with-pandas
geocoder_nom = Nominatim(user_agent="_solidata_app_")
geocoder_ban = BANFrance(user_agent="_solidata_app_")

### rate limiter
geocode_nom = RateLimiter(geocoder_nom.geocode, min_delay_seconds=dft_delay)
geocode_ban = RateLimiter(geocoder_ban.geocode, min_delay_seconds=dft_delay)

In [None]:
df_01[location_col+"_nom"] = df_01[full_address_col].apply(partial(geocode_nom, language='en'))

In [None]:
df_02[location_col+"_ban"] = df_02[full_address_col].progress_apply(geocode_ban)
# df_02[location_col+"_ban"] = df_02[full_address_col].apply(geocode_ban)

In [None]:
df_02.sample(10)