## *Jeu de données IRVE*
-------------------
# Analyse des relations entre champs (intégrité des données)
------------------------------
## Contexte
- clarification du rôle des modèles de données dans les jeux de données (cf mise à jour récente des [guides data.gouv](https://guides.etalab.gouv.fr/qualite/documenter-les-donnees/))
- intégration d'une propriété "relationship" dans les schémas de données ([issue TableSchema](https://github.com/frictionlessdata/specs/issues/803) en cours de validation)
- création d'outils de contrôle des relations entre champs des jeux de données tabulaires (cf usage ci-dessous)

## Objectifs
- valider sur un cas réel l'utilisation d'un modèle de données en complément d'un schéma de données
- identifier les apports que pourraient avoir les contrôles de validation des relations entre champs

## Résultats
- la formalisation d'un modèle de données facilite la compréhension des données et des relations entre champs
- l'outil de contrôle permet d'améliorer significativement la qualité des données par l'identification d'incohérences de relations
- l'identification des incohérences permet de trouver des stratégies de réduction des écarts (dans l'exemple ci-dessous, on passe 36% d'écart à 3,8 %)  
- l'analyse des données permet de (re)construire le modèle de données qui minimise les incohérences
- les incohérences détectées sur le jeu de données IRVE restent faibles (inférieures à 4% des point de charge documentés - voir chapitre 4)

## Suite à donner
- Mettre à jour, valider et publier le modèle de données IRVE
- Définir les contrôles supplémentaires à intégrer pour toutes nouvelles données ainsi que pour le jeu complet
- Mettre en oeuvre les outils de contrôle

## Evolutions possibles 
- Ajouter dans les guides d'Etalab un guide pour les modèles de données 
- Intégrer dans les schémas de données la propriété "relationship" en cours de validation,
- Définir un indicateur qui mesure l'écart (existant / attendu) des relations entre champs

## Sommaire
*(liens actifs sur jupyter Notebook ou Nbviewer)*
- [1 - modèle de données](#1---modèle-de-données)
- [2 - Initialisation](#2---Initialisation)
- [3 - Séparation des pdc itinerance et hors itinerance](#3---Séparation-des-pdc-itinerance-et-hors-itinerance)
- [4 - Bilan initial intégrité](#4---Bilan-initial-intégrité)
- [5 - Séparation doublons pdc - date de maj](#5---Séparation-doublons-pdc---date-de-maj)
- [6 - Séparation doublons station - date de maj](#6---Séparation-doublons-station---date-de-maj)
- [7 - Synthèse](#7---Synthèse)
- [8 - Exemples d erreurs résiduelles](#8---Exemples-d-erreurs-résiduelles)
- [Annexe : Initialisation du modèle de données 'mermaid'](#Annexe-:-Initialisation-du-modèle-de-données-'mermaid')

Ce Notebook peut être consulté sur [nbviewer](http://nbviewer.org/github/loco-philippe/Environmental-Sensing/tree/main/python/Validation/irve)

données utilisées : https://www.data.gouv.fr/fr/datasets/fichier-consolide-des-bornes-de-recharge-pour-vehicules-electriques/    
fichier : "*consolidation-etalab-schema-irve-statique-v-2.2.0-20230303.csv*"

-----------------------
# 1 - modèle de données

Le modèle de données proposé ci-dessous est construit sur la base du schéma de données mis à disposition et du contenu du jeu de données.    
Il est à consolider en fonction de l'expertise des concepteurs et réutilisateurs (voir [guide méthodologique](https://github.com/loco-philippe/Environmental-Sensing/blob/main/property_relationship/FR_methodology.ipynb)).

*Notation:*
- *M : Mandatory - documentation obligatoire*
- *PK : Primary Key - identifiant unique de l'entité*
- *Root : champ fictif associé à une ligne du tableau*

In [1]:
from base64 import b64encode
from IPython.display import Image, display
with open('IRVE_modele.txt', 'r', encoding="utf-8") as f:
    modele = f.read()
display(Image(url="https://mermaid.ink/img/" + b64encode(modele.encode("ascii")).decode("ascii")))

In [2]:
def analyse_integrite(data, fields, pr=True):
    '''analyse les relations du DataFrame définies dans le dict fields et retourne un dict avec pour chaque contrôle la
    liste des index ko. Les résultats des contrôles sont également ajoutés sous forme de champs booléens à data'''
    analyse = Analysis(data)
    dic_res = analyse.check_relationship(fields)
    data['ok'] = True
    for name, lis in dic_res.items():
        data[name] = True
        data.loc[lis, name] = False
        data['ok'] = data['ok'] & data[name]
        if pr:
            print('{:<50} {:>5}'.format(name, len(data) - data[name].sum()))
    return dic_res

------
# 2 - Initialisation
## initialisation des données
- lecture du fichier issu de l'api

In [3]:
from datetime import datetime
import json
from observation import Ilist, Analysis
import pandas as pd
log = {'date_irve': '2023-03-03', 'file': 'consolidation-etalab-schema-irve-statique-v-2.2.0-20230303.csv',
      'chemin': 'https://raw.githubusercontent.com/loco-philippe/Environmental-Sensing/main/python/Validation/irve/Analyse/'}
irve = pd.read_csv(log['chemin'] + log['file'], sep=',', low_memory=False)
log['len_irve'] = len(irve)
print('nombre de lignes : ', log['len_irve']) 

nombre de lignes :  51276


## schéma de données
Le schéma de données restreint à la propriété 'relationship' et construit à partir du modèle de données est le suivants :

In [4]:
fields = [
 
 # relation unicité des pdl
 { "name": "index",
   "relationship" : { "parent" : "id_pdc_itinerance", "link" : "coupled" }},   
 # relations inter entités
 { "name": "contact_operateur",
   "relationship" : { "parent" : "id_station_itinerance", "link" : "derived" }},
 { "name": "nom_enseigne",
   "relationship" : { "parent" : "id_station_itinerance", "link" : "derived" }},
 { "name": "coordonneesXY",
   "relationship" : { "parent" : "id_station_itinerance", "link" : "derived" }},
 { "name": "id_station_itinerance",
   "relationship" : { "parent" : "id_pdc_itinerance",     "link" : "derived" }},
 # relations intra entité - station
 { "name": "nom_station",
   "relationship" : { "parent" : "id_station_itinerance", "link" : "derived" }},
 { "name": "implantation_station",
   "relationship" : { "parent" : "id_station_itinerance", "link" : "derived" }},
 #{ "name": "date_maj",
 #  "relationship" : { "parent" : "id_station_itinerance", "link" : "derived" }},
 { "name": "nbre_pdc",
   "relationship" : { "parent" : "id_station_itinerance", "link" : "derived" }},
 { "name": "condition_acces",
   "relationship" : { "parent" : "id_station_itinerance", "link" : "derived" }},
 { "name": "horaires",
   "relationship" : { "parent" : "id_station_itinerance", "link" : "derived" }},
 { "name": "station_deux_roues",
   "relationship" : { "parent" : "id_station_itinerance", "link" : "derived" }},
 # relations intra entité - localisation
 { "name": "adresse_station",
   "relationship" : { "parent" : "coordonneesXY",         "link" : "derived" }} ]

# liste des champs liés à un controle (relations) et obligatoires (mandatory)
relations = ['index', 'contact_operateur', 'nom_enseigne', 'coordonneesXY', 'adresse_station', 'id_station_itinerance', 
             'nom_station', 'implantation_station', 'nbre_pdc', 'condition_acces', 'horaires', 'station_deux_roues', 
             'id_pdc_itinerance', 'date_maj', 'last_modified']
mandatory =  ['contact_operateur', 'nom_enseigne', 'coordonneesXY', 'adresse_station', 'id_station_itinerance', 'nom_station',
           'implantation_station', 'nbre_pdc', 'condition_acces', 'horaires', 'station_deux_roues', 'id_pdc_itinerance', 
           'puissance_nominale', 'prise_type_ef', 'prise_type_2', 'prise_type_combo_ccs', 'prise_type_chademo', 
           'prise_type_autre', 'paiement_acte', 'paiement_autre', 'reservation',  'accessibilite_pmr', 'restriction_gabarit', 
           'date_maj', 'last_modified']

-----------------------
## 3 - Séparation des pdc itinerance et hors itinerance
- un peu moins de 1 % des points de charge sont hors itinerance

In [5]:
data = irve
data[['id_station_itinerance','id_pdc_itinerance']] = data[['id_station_itinerance','id_pdc_itinerance']].astype('string')
#data[['last_modified','date_maj']] = data[['last_modified','date_maj']].astype('datetime64')
data['non_concerne'] = data['id_station_itinerance'].str.contains('oncern') | data['id_pdc_itinerance'].str.contains('oncern')

non_concerne = data[data['non_concerne']].reset_index()['index']
itinerance = data[~data['non_concerne']].reset_index()
itinerance_init = itinerance.loc[:, relations]
log['pdc_hors_itinerance'] = len(non_concerne)
log['pdc_en_itinerance'] = len(itinerance)
print('nombre de pdc hors itinerance : ', log['pdc_hors_itinerance'])
print('nombre de pdc en itinerance   : ', log['pdc_en_itinerance'])

nombre de pdc hors itinerance :  607
nombre de pdc en itinerance   :  50669


In [6]:
# arborescence des champs et nombre de valeurs différentes
il = Ilist.obj(itinerance_init)
print(il.tree())

-1: root-derived (50669)
   0 : index (50669)
      1 : contact_operateur (120)
      2 : nom_enseigne (1132)
      3 : coordonneesXY (16849)
      4 : adresse_station (16094)
      5 : id_station_itinerance (18535)
      6 : nom_station (15058)
      7 : implantation_station (5)
      8 : nbre_pdc (43)
      9 : condition_acces (2)
      10: horaires (453)
      11: station_deux_roues (7)
      12: id_pdc_itinerance (42368)
      13: date_maj (565)
      14: last_modified (444)


-----------------------
## 4 - Bilan initial intégrité
- 36 % des lignes sont erronées ( 18 116 )

In [7]:
# séparation données bonnes (itinerance_ok_1) et données résiduelles (itinerance_1)
res = analyse_integrite(itinerance_init, fields)
itinerance_ok_1 = itinerance_init.loc[itinerance_init.ok, relations].reset_index(drop=True)
itinerance_1 = itinerance_init.loc[~itinerance_init.ok, relations].reset_index(drop=True)
itinerance_init = itinerance_init.loc[:, relations]
log['init_ok'] = len(itinerance_ok_1)
log['init_ko'] = len(itinerance_1)
print("\nnombre d'enregistrements sans erreurs : ", log['init_ok'])
print("nombre d'enregistrements avec au moins une erreur : ", log['init_ko'])
print("taux d'erreur : ", round(log['init_ko'] / log['pdc_en_itinerance'] * 100), ' %')

index - id_pdc_itinerance                          16123
contact_operateur - id_station_itinerance          10719
nom_enseigne - id_station_itinerance                7514
coordonneesXY - id_station_itinerance              11825
id_station_itinerance - id_pdc_itinerance            578
nom_station - id_station_itinerance                 1865
implantation_station - id_station_itinerance        1245
nbre_pdc - id_station_itinerance                    1458
condition_acces - id_station_itinerance               35
horaires - id_station_itinerance                    9869
station_deux_roues - id_station_itinerance         10968
adresse_station - coordonneesXY                     1360

nombre d'enregistrements sans erreurs :  32553
nombre d'enregistrements avec au moins une erreur :  18116
taux d'erreur :  36  %


-----------------------
## 5 - Séparation doublons pdc - date de maj
- la moitié des pdc en erreur sont liées aux doublons de pdc
- la suppression des doublons permet de diviser par 5 le nombre de lignes erronnées ( 2 166 )

In [8]:
# séparation doublons pdc (doublons_pdc) et données résiduelles (itinerance_2)
itinerance_1['doublons_pdc'] = itinerance_1.sort_values(by='date_maj').duplicated('id_pdc_itinerance', keep='last')

doublons_pdc = itinerance_1[itinerance_1['doublons_pdc']].loc[:, relations].reset_index(drop=True)['index']
itinerance_2 = itinerance_1[~itinerance_1['doublons_pdc']].loc[:, relations].reset_index(drop=True)
itinerance_1 = itinerance_1.loc[:, relations]
log['doublons_pdc'] = len(doublons_pdc)
log['sans_doublons_pdc'] = len(itinerance_2)
print('nombre de doublons pdc : ', log['doublons_pdc'])
print('nombre de pdc sans doublon   : ', log['sans_doublons_pdc'])

nombre de doublons pdc :  8301
nombre de pdc sans doublon   :  9815


In [9]:
# séparation données bonnes (itinerance_ok_3) et données résiduelles (itinerance_3)
res = analyse_integrite(itinerance_2, fields)
itinerance_ok_3 = itinerance_2.loc[itinerance_2.ok, relations].reset_index(drop=True)
itinerance_3 = itinerance_2.loc[~itinerance_2.ok, relations].reset_index(drop=True)
itinerance_2 = itinerance_2.loc[:, relations]
log['etape3_ok'] = len(itinerance_ok_3)
log['etape3_ko'] = len(itinerance_3)
print("\nnombre d'enregistrements sans erreurs : ", log['etape3_ok'])
print("nombre d'enregistrements avec au moins une erreur : ", log['etape3_ko'])

index - id_pdc_itinerance                              0
contact_operateur - id_station_itinerance            200
nom_enseigne - id_station_itinerance                 457
coordonneesXY - id_station_itinerance                624
id_station_itinerance - id_pdc_itinerance              0
nom_station - id_station_itinerance                  204
implantation_station - id_station_itinerance         136
nbre_pdc - id_station_itinerance                     513
condition_acces - id_station_itinerance                5
horaires - id_station_itinerance                     194
station_deux_roues - id_station_itinerance           521
adresse_station - coordonneesXY                      587

nombre d'enregistrements sans erreurs :  7649
nombre d'enregistrements avec au moins une erreur :  2166


-----------------------
## 6 - Séparation doublons station - date de maj
- 20% des erreurs résiduelles sont liées au mélange d'anciens et de nouveaux pdc
- la suppression des anciens pdc permet de réduire de 25% le nombre de lignes erronnées ( 1 616 )
- les dernières erreurs correspondent à 468 stations associées à 32 opérateurs et sont liées à des causes multiples

In [10]:
# séparation doublons stations (doublons_stat_maj) et données résiduelles (itinerance_4)
itinerance_3['stat_maj'] = itinerance_3.id_station_itinerance + itinerance_3.date_maj
stat_maj_unique = itinerance_3.sort_values(by='stat_maj').drop_duplicates('id_station_itinerance', keep='last')
itinerance_3['last_stat_maj'] = itinerance_3['stat_maj'].isin(stat_maj_unique['stat_maj'])

doublons_stat_maj = itinerance_3[~itinerance_3['last_stat_maj']].loc[:, relations].reset_index(drop=True)['index']
itinerance_4 = itinerance_3[itinerance_3['last_stat_maj']].loc[:, relations].reset_index(drop=True)
itinerance_3 = itinerance_3.loc[:, relations]
log['doublons_station'] = len(doublons_stat_maj)
log['sans_doublons_station'] = len(itinerance_4)
print('nombre de doublons stations : ', log['doublons_station'])
print('nombre de pdc sans doublon   : ', log['sans_doublons_station'])

nombre de doublons stations :  375
nombre de pdc sans doublon   :  1791


In [11]:
# séparation données bonnes (itinerance_ok_5) et données résiduelles (itinerance_5 / itinerance_5_full)
res = analyse_integrite(itinerance_4, fields)
itinerance_ok_5 = itinerance_4.loc[itinerance_4.ok, relations].reset_index(drop=True)
itinerance_5_full = itinerance_4.loc[~itinerance_4.ok].reset_index(drop=True)
itinerance_5 = itinerance_5_full.loc[:, relations]
#itinerance_4 = itinerance_4.loc[:, relations]
log['etape5_ok'] = len(itinerance_ok_5)
log['etape5_ko'] = len(itinerance_5)
print("\nnombre d'enregistrements sans erreurs : ", log['etape5_ok'])
print("nombre d'enregistrements avec au moins une erreur : ", log['etape5_ko'])

index - id_pdc_itinerance                              0
contact_operateur - id_station_itinerance              0
nom_enseigne - id_station_itinerance                 267
coordonneesXY - id_station_itinerance                216
id_station_itinerance - id_pdc_itinerance              0
nom_station - id_station_itinerance                   40
implantation_station - id_station_itinerance          23
nbre_pdc - id_station_itinerance                     452
condition_acces - id_station_itinerance                0
horaires - id_station_itinerance                      53
station_deux_roues - id_station_itinerance           325
adresse_station - coordonneesXY                      414

nombre d'enregistrements sans erreurs :  175
nombre d'enregistrements avec au moins une erreur :  1616


In [12]:
# structure des données résiduelles et nombre de valeurs
il = Ilist.obj(itinerance_5)
print(il.tree())

-1: root-derived (1616)
   0 : index (1616)
      2 : nom_enseigne (317)
         9 : condition_acces (2)
      3 : coordonneesXY (413)
      4 : adresse_station (468)
         1 : contact_operateur (32)
      5 : id_station_itinerance (468)
         13: date_maj (82)
      6 : nom_station (432)
      7 : implantation_station (4)
      8 : nbre_pdc (21)
      10: horaires (49)
      11: station_deux_roues (5)
      12: id_pdc_itinerance (1616)
      14: last_modified (54)


In [13]:
# nb maxi d'erreurs
itinerance_4['somme'] = 0
for name in res.keys():
    itinerance_4['somme'] += 1 - itinerance_4[name]
erreurs = max(itinerance_4['somme'])
maxi = itinerance_4[itinerance_4.somme >= erreurs]
print("nombre d'enregistrements avec ", erreurs, " erreurs : ", len(maxi))

nombre d'enregistrements avec  4  erreurs :  12


-----------------------
## 7 - Synthèse


In [14]:
# consolidation des données
itinerance['doublons_stat_maj'] = itinerance['index'].isin(doublons_stat_maj)
itinerance['doublons_pdc'] = itinerance['index'].isin(doublons_pdc)
itinerance['lignes_a_corriger'] = itinerance['index'].isin(itinerance_5['index'])
itinerance['doublons_a_supprimer'] = itinerance['doublons_stat_maj'] | itinerance['doublons_pdc']
itinerance['lignes_ko'] = itinerance['doublons_a_supprimer'] | itinerance['lignes_a_corriger']
print('total des lignes à corriger : ', itinerance['lignes_a_corriger'].sum())
itinerance_doublons = itinerance[itinerance['doublons_a_supprimer']].reset_index(drop=True)
print('total des doublons à supprimer : ', len(itinerance_doublons))
itinerance_ok = itinerance[~itinerance['lignes_ko']].reset_index(drop=True)
print('nombre de pdc avec controles ok : ', len(itinerance_ok))

total des lignes à corriger :  1616
total des doublons à supprimer :  8676
nombre de pdc avec controles ok :  40377


In [15]:
#fichier csv des lignes résiduelles à traiter (IRVE_itinerance_residuel)
#fichier csv des données itinerance avec indicateur des données à corriger ou à ignorer (IRVE_itinerance_complet)
#fichier csv des données itinerance valides (IRVE_itinerance_valide)
#fichier csv des doublons (IRVE_itinerance_doublons)
extension = log['date_irve'] +'.csv'
itinerance_5_full.to_csv('IRVE_itinerance_residuel' + extension)
itinerance.to_csv('IRVE_itinerance_complet' + extension)
itinerance_ok.to_csv('IRVE_itinerance_valide' + extension)
itinerance_doublons.to_csv('IRVE_itinerance_doublons' + extension)
log['IRVE_itinerance_residuel' + extension] = len(itinerance_5_full)
log['IRVE_itinerance_complet' + extension] = len(itinerance)
log['IRVE_itinerance_valide' + extension] = len(itinerance_ok)
log['IRVE_itinerance_doublons' + extension] = len(itinerance_doublons)

In [16]:
# vérification de l'intégrité
print('\nbilan intégrité :')
res = analyse_integrite(itinerance_ok.loc[:, relations], fields, pr=False)
log['bilan_erreurs'] = sum([len(controle) for controle in res.values()])
log['date'] = datetime.now().isoformat()
print('\nerreurs : ', log['bilan_erreurs'])


bilan intégrité :

erreurs :  0


In [17]:
with open('logfile.txt', 'a', encoding="utf-8") as f:
    f.write(json.dumps(log) + '\n')
print(log)

{'date_irve': '2023-03-03', 'file': 'consolidation-etalab-schema-irve-statique-v-2.2.0-20230303.csv', 'chemin': 'https://raw.githubusercontent.com/loco-philippe/Environmental-Sensing/main/python/Validation/irve/Analyse/', 'len_irve': 51276, 'pdc_hors_itinerance': 607, 'pdc_en_itinerance': 50669, 'init_ok': 32553, 'init_ko': 18116, 'doublons_pdc': 8301, 'sans_doublons_pdc': 9815, 'etape3_ok': 7649, 'etape3_ko': 2166, 'doublons_station': 375, 'sans_doublons_station': 1791, 'etape5_ok': 175, 'etape5_ko': 1616, 'IRVE_itinerance_residuel2023-03-03.csv': 1616, 'IRVE_itinerance_complet2023-03-03.csv': 50669, 'IRVE_itinerance_valide2023-03-03.csv': 40377, 'IRVE_itinerance_doublons2023-03-03.csv': 8676, 'bilan_erreurs': 0, 'date': '2023-04-17T23:49:47.567173'}


In [18]:
# structure des données bonnes
il = Ilist.obj(itinerance_ok.loc[:, mandatory])
print(il.tree())

-1: root-derived (40377)
   11: id_pdc_itinerance (40377)
      4 : id_station_itinerance (18006)
         1 : nom_enseigne (818)
         2 : coordonneesXY (14075)
            0 : contact_operateur (103)
            3 : adresse_station (13491)
               8 : condition_acces (2)
         5 : nom_station (14149)
         6 : implantation_station (5)
         7 : nbre_pdc (42)
         9 : horaires (411)
         10: station_deux_roues (6)
         19: paiement_autre (7)
      12: puissance_nominale (79)
      13: prise_type_ef (8)
      14: prise_type_2 (8)
      15: prise_type_combo_ccs (8)
      16: prise_type_chademo (7)
      17: prise_type_autre (7)
      18: paiement_acte (8)
      20: reservation (6)
      21: accessibilite_pmr (4)
      22: restriction_gabarit (84)
      23: date_maj (428)
      24: last_modified (361)


-----------------------
## 8 - Exemples d erreurs résiduelles 

### Erreurs multiples 
- exemple avec le nombre maximal d'erreurs (4) (2 stations soit 12 pdc avec : adresse, nom, nbre_pdc et deux-roues erronés)

In [19]:
maxi.loc[:, relations]

Unnamed: 0,index,contact_operateur,nom_enseigne,coordonneesXY,adresse_station,id_station_itinerance,nom_station,implantation_station,nbre_pdc,condition_acces,horaires,station_deux_roues,id_pdc_itinerance,date_maj,last_modified
1536,47980,assistance.technique@tevgo.fr,Belib',"[2.314663, 48.8737]",37 Rue la BoÃ©tie 75008 Paris,FRV75PPX0811,Paris | Rue la BoÃ©tie 37,Voirie,5,Accès libre,24/7,True,FRV75EPX08112,2022-12-16,2023-03-03T17:35:31.881000
1537,47981,assistance.technique@tevgo.fr,Belib',"[2.314663, 48.8737]",37 Rue la BoÃ©tie 75008 Paris,FRV75PPX0811,Paris | Rue la BoÃ©tie 37,Voirie,5,Accès libre,24/7,True,FRV75EPX08111,2022-12-16,2023-03-03T17:35:31.881000
1538,47982,assistance.technique@tevgo.fr,Belib',"[2.314663, 48.8737]",37 Rue la BoÃ©tie 75008 Paris,FRV75PPX0811,Paris | Rue la BoÃ©tie 37,Voirie,5,Accès libre,24/7,False,FRV75EPX08114,2022-12-16,2023-03-03T17:35:31.881000
1539,47983,assistance.technique@tevgo.fr,Belib',"[2.314663, 48.8737]",37 Rue la BoÃ©tie 75008 Paris,FRV75PPX0811,Paris | Rue la BoÃ©tie 37,Voirie,5,Accès libre,24/7,False,FRV75EPX08113,2022-12-16,2023-03-03T17:35:31.881000
1540,47984,assistance.technique@tevgo.fr,Belib',"[2.314663, 48.8737]",37 Rue la BoÃ©tie 75008 Paris,FRV75PPX0811,Paris | Rue la BoÃ©tie 37,Voirie,5,Accès libre,24/7,False,FRV75EPX08115,2022-12-16,2023-03-03T17:35:31.881000
1541,47985,assistance.technique@tevgo.fr,Belib',"[2.314663, 48.8737]",37 Rue la Boétie 75008 Paris,FRV75PPX0811,Paris | Rue la Boétie 37,Voirie,6,Accès libre,24/7,False,FRV75EPX08116,2022-12-16,2023-03-03T17:35:31.881000
1648,49154,assistance.technique@tevgo.fr,Belib',"[2.360503, 48.86502]",18 Rue PerrÃ©e 75003 Paris,FRV75PPX0304,Paris | Rue PerrÃ©e 18,Voirie,5,Accès libre,24/7,False,FRV75EPX03041,2022-12-16,2023-03-03T17:35:31.881000
1649,49155,assistance.technique@tevgo.fr,Belib',"[2.360503, 48.86502]",18 Rue PerrÃ©e 75003 Paris,FRV75PPX0304,Paris | Rue PerrÃ©e 18,Voirie,5,Accès libre,24/7,False,FRV75EPX03042,2022-12-16,2023-03-03T17:35:31.881000
1650,49156,assistance.technique@tevgo.fr,Belib',"[2.360503, 48.86502]",18 Rue PerrÃ©e 75003 Paris,FRV75PPX0304,Paris | Rue PerrÃ©e 18,Voirie,5,Accès libre,24/7,False,FRV75EPX03043,2022-12-16,2023-03-03T17:35:31.881000
1651,49157,assistance.technique@tevgo.fr,Belib',"[2.360503, 48.86502]",18 Rue PerrÃ©e 75003 Paris,FRV75PPX0304,Paris | Rue PerrÃ©e 18,Voirie,5,Accès libre,24/7,False,FRV75EPX03044,2022-12-16,2023-03-03T17:35:31.881000


### Cohérence implantation_station - id_station
- 23 pdc sont liés à une erreur de choix d'implantation (3 stations, 1 opérateur)

In [20]:
itinerance_4.loc[~itinerance_4['implantation_station - id_station_itinerance'], relations]

Unnamed: 0,index,contact_operateur,nom_enseigne,coordonneesXY,adresse_station,id_station_itinerance,nom_station,implantation_station,nbre_pdc,condition_acces,horaires,station_deux_roues,id_pdc_itinerance,date_maj,last_modified
1363,43183,contact@qovoltis.com,QOVOLTIS,"[-2.7649063, 48.4941535]",52 RUE DU GUÉ LAMBERT Hôtel Kyriad Direct Sain...,FRQOVP2200002,52 RUE DU GUÉ LAMBERT Hôtel Kyriad Direct Sai,Parking privé à usage public,6,Accès libre,24/7,0,FRQOVE201290,2022-07-25,2023-03-03T17:36:05.518000
1364,43184,contact@qovoltis.com,QOVOLTIS,"[-2.7649063, 48.4941535]",52 RUE DU GUÉ LAMBERT Hôtel Kyriad Direct Sain...,FRQOVP2200002,52 RUE DU GUÉ LAMBERT Hôtel Kyriad Direct Sai,Parking privé à usage public,6,Accès libre,24/7,0,FRQOVE201426,2022-07-25,2023-03-03T17:36:05.518000
1365,43185,contact@qovoltis.com,QOVOLTIS,"[-2.7649063, 48.4941535]",52 RUE DU GUÉ LAMBERT Hôtel Kyriad Direct Sain...,FRQOVP2200002,52 RUE DU GUÉ LAMBERT Hôtel Kyriad Direct Sai,Parking privé à usage public,6,Accès libre,24/7,0,FRQOVE201396,2022-07-25,2023-03-03T17:36:05.518000
1366,43186,contact@qovoltis.com,QOVOLTIS,"[-0.69173, 44.83914]","19 AVENUE NEIL ARMSTRONG, Le Caucase 33700 MER...",FRQOVP3300015,"19 AVENUE NEIL ARMSTRONG, Le Caucase 33700 ME",Parking privé à usage public,6,Accès libre,Mo-Fr 09:00-19:00,0,FRQOVE207049,2022-05-24,2023-03-03T17:36:05.518000
1367,43187,contact@qovoltis.com,QOVOLTIS,"[-0.69173, 44.83914]","19 AVENUE NEIL ARMSTRONG, Le Caucase 33700 MER...",FRQOVP3300015,"19 AVENUE NEIL ARMSTRONG, Le Caucase 33700 ME",Parking privé à usage public,6,Accès libre,Mo-Fr 09:00-19:00,0,FRQOVE206440,2022-05-24,2023-03-03T17:36:05.518000
1368,43188,contact@qovoltis.com,QOVOLTIS,"[-0.69173, 44.83914]","19 AVENUE NEIL ARMSTRONG, Le Caucase 33700 MER...",FRQOVP3300015,"19 AVENUE NEIL ARMSTRONG, Le Caucase 33700 ME",Parking privé à usage public,6,Accès libre,Mo-Fr 09:00-19:00,0,FRQOVE207495,2022-05-24,2023-03-03T17:36:05.518000
1369,43190,contact@qovoltis.com,QOVOLTIS,"[-0.69173, 44.83914]","19 AVENUE NEIL ARMSTRONG, Le Caucase 33700 MER...",FRQOVP3300015,"19 AVENUE NEIL ARMSTRONG, Le Caucase 33700 ME",Parking privé à usage public,6,Accès libre,Mo-Fr 09:00-19:00,0,FRQOVE203131,2022-05-24,2023-03-03T17:36:05.518000
1372,43282,contact@qovoltis.com,QOVOLTIS,"[-0.69173, 44.83914]","19 AVENUE NEIL ARMSTRONG, Le Caucase 33700 MER...",FRQOVP3300015,"19 AVENUE NEIL ARMSTRONG, Le Caucase 33700 ME",Parking privé à usage public,6,Accès libre,Mo-Fr 09:00-19:00,0,FRQOVE203131TE,2022-05-24,2023-03-03T17:36:05.518000
1373,43283,contact@qovoltis.com,QOVOLTIS,"[-2.7649063, 48.4941535]",52 RUE DU GUÉ LAMBERT Hôtel Kyriad Direct Sain...,FRQOVP2200002,52 RUE DU GUÉ LAMBERT Hôtel Kyriad Direct Sai,Parking privé à usage public,6,Accès libre,24/7,0,FRQOVE205871TE,2022-07-25,2023-03-03T17:36:05.518000
1375,43343,contact@qovoltis.com,QOVOLTIS,"[1.8088319, 43.6986226]",1 AVENUE GEORGES POMPIDOU 81500 LAVAUR,FRQOVP8100001,1 AVENUE GEORGES POMPIDOU 81500 LAVAUR,Parking privé à usage public,6,Accès libre,24/7,0,FRQOVE205471,2022-05-10,2023-03-03T17:36:05.518000


### Cohérence nom_station - id_station
- 40 pdc sont associés à une station avec un nom non cohérent

In [21]:
itinerance_4.loc[~itinerance_4['nom_station - id_station_itinerance'], relations]

Unnamed: 0,index,contact_operateur,nom_enseigne,coordonneesXY,adresse_station,id_station_itinerance,nom_station,implantation_station,nbre_pdc,condition_acces,horaires,station_deux_roues,id_pdc_itinerance,date_maj,last_modified
81,1752,service-recharge@soregies.fr,ALTERBASE86,"[0.37178, 46.56869]","78, avenue Jacques Coeur - 86000 - Poitiers",FRS86PSOREB140,Sorégies 3,Parking privé à usage public,2,Accès libre,24/7,false,FRS86ESOREB1402,2020-04-30,2023-03-03T17:40:12.327000
82,1753,service-recharge@soregies.fr,ALTERBASE86,"[0.37178, 46.56869]","78, avenue Jacques Coeur - 86000 - Poitiers",FRS86PSOREB140,Sorégies 2,Parking privé à usage public,2,Accès libre,24/7,false,FRS86ESOREB1401,2020-04-30,2023-03-03T17:40:12.327000
107,2862,support@lastmilesolutions.com,Last Mile Solutions,"[5.585043, 47.149426]",Aire de Dole Audelange - Autoroute A36 - 39700...,FRLMSP1000123210,APRR DOLE ROMANGE,Station dédiée à la recharge rapide,1,Accès libre,24/7,false,FRLMSE10001232101,2023-02-15,2023-03-03T17:39:38.719000
108,2864,support@lastmilesolutions.com,Last Mile Solutions,"[5.585043, 47.149426]",Aire de Dole Audelange - Autoroute A36 - 39700...,FRLMSP1000123211,APRR DOLE ROMANGE,Station dédiée à la recharge rapide,1,Accès libre,24/7,false,FRLMSE10001232111,2023-02-15,2023-03-03T17:39:38.719000
109,2877,support@lastmilesolutions.com,Last Mile Solutions,"[5.585043, 47.149426]",Aire de Dole Audelange - Autoroute A36 - 39700...,FRLMSP1000123211,APRR DOLE AUDELANGE,Station dédiée à la recharge rapide,1,Accès libre,24/7,false,FRLMSE10001232112,2023-02-15,2023-03-03T17:39:38.719000
110,2878,support@lastmilesolutions.com,Last Mile Solutions,"[5.585043, 47.149426]",Aire de Dole Audelange - Autoroute A36 - 39700...,FRLMSP1000123210,APRR DOLE AUDELANGE,Station dédiée à la recharge rapide,1,Accès libre,24/7,false,FRLMSE10001232102,2023-02-15,2023-03-03T17:39:38.719000
254,6412,support@alizecharge.fr,CPO Alizé Liberté Public,"[1.45026, 43.6040701]",63 Bd Lazare Carnot 31000 Toulouse,FRTLSP31555040,TOULOUSE – Station Deux-Roues Lazare Carnot,Voirie,3,Accès libre,Mo-Su 00:00-23:59,FALSE,FRTLSE315550405,2022-12-15,2023-03-03T17:39:32.426000
256,6431,support@alizecharge.fr,CPO Alizé Liberté Public,"[1.45026, 43.6040701]",63 Bd Lazare Carnot 31000 Toulouse,FRTLSP31555040,TOULOUSE – Station Deux-Roues Lazare Carnot,Voirie,3,Accès libre,Mo-Su 00:00-23:59,FALSE,FRTLSE315550403,2022-12-15,2023-03-03T17:39:32.426000
257,6435,support@alizecharge.fr,CPO Alizé Liberté Public,"[1.45026, 43.6040701]",63 Bd Lazare Carnot 31000 Toulouse,FRTLSP31555040,TOULOUSE – Station Deux-Roues Lazare Carnot,Voirie,3,Accès libre,Mo-Su 00:00-23:59,FALSE,FRTLSE315550404,2022-12-15,2023-03-03T17:39:32.426000
310,7672,support@alizecharge.fr,CPO Alizé Liberté Public,"[1.4503666, 43.6039735]",TOULOUSE - Bd Lazare Carnot,FRTLSP31555040,TOULOUSE - Bd Lazare Carnot,Voirie,2,Accès libre,Mo-Su 00:00-23:59,FALSE,FRTLSE315550401,2022-12-15,2023-03-03T17:39:32.426000


### Cohérence adresse - coordonnées
- 414 pdc ont une adresse non cohérente avec les coordonnées géographiques

In [22]:
itinerance_4.loc[~itinerance_4['adresse_station - coordonneesXY'], relations]

Unnamed: 0,index,contact_operateur,nom_enseigne,coordonneesXY,adresse_station,id_station_itinerance,nom_station,implantation_station,nbre_pdc,condition_acces,horaires,station_deux_roues,id_pdc_itinerance,date_maj,last_modified
0,10,info@rossinienergy.com,RossiniEnergy,"[3.262326, 49.856113]","4 Avenue Archimède, 02100 Saint-Quentin",FRROSE352,Aventim_PC_1,Parking privé à usage public,10,Accès libre,24/7,FALSE,FRROSE3521,2022-07-12,2023-03-03T17:43:34.993000
1,11,info@rossinienergy.com,RossiniEnergy,"[3.262326, 49.856113]","7 Avenue Archimède, 02100 Saint-Quentin",FRROSE352,Aventim_PC_1,Parking privé à usage public,10,Accès libre,24/7,FALSE,FRROSE3524,2022-07-12,2023-03-03T17:43:34.993000
2,12,info@rossinienergy.com,RossiniEnergy,"[3.262326, 49.856113]","6 Avenue Archimède, 02100 Saint-Quentin",FRROSE352,Aventim_PC_1,Parking privé à usage public,10,Accès libre,24/7,FALSE,FRROSE3523,2022-07-12,2023-03-03T17:43:34.993000
3,13,info@rossinienergy.com,RossiniEnergy,"[3.262326, 49.856113]","5 Avenue Archimède, 02100 Saint-Quentin",FRROSE352,Aventim_PC_1,Parking privé à usage public,10,Accès libre,24/7,FALSE,FRROSE3522,2022-07-12,2023-03-03T17:43:34.993000
4,17,info@rossinienergy.com,RossiniEnergy,"[3.262326, 49.856113]","9 Avenue Archimède, 02100 Saint-Quentin",FRROSE351,Aventim_PC_2,Parking privé à usage public,10,Accès libre,24/7,FALSE,FRROSE3512,2022-07-12,2023-03-03T17:43:34.993000
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1786,50861,supervision-ev.france@totalenergies.com,RIESTER MEAUX,"[2.87930851314442, 48.94679007929618]",52 Rue François De Tessan 77100 Meaux,FRTCBP00702,RIESTER MEAUX,Parking privé à usage public,4,Accès libre,"Mo-Fr 08:30-12:00,Mo-Fr 13:30-19:00,Sa 09:00-1...",false,FRTCBE003959,2023-01-27,2023-03-03T17:35:31.203000
1787,50862,supervision-ev.france@totalenergies.com,RIESTER MEAUX,"[2.87930851314442, 48.94679007929618]",52 Rue François De Tessan 77100 Meaux,FRTCBP00702,RIESTER MEAUX,Parking privé à usage public,4,Accès libre,"Mo-Fr 08:30-12:00,Mo-Fr 13:30-19:00,Sa 09:00-1...",false,FRTCBE003958,2023-01-27,2023-03-03T17:35:31.203000
1788,50863,supervision-ev.france@totalenergies.com,RIESTER MEAUX,"[2.87930851314442, 48.94679007929618]",51 Rue François De Tessan 77100 Meaux,FRTCBP00702,RIESTER MEAUX,Parking privé à usage public,4,Accès libre,"Mo-Fr 08:30-12:00,Mo-Fr 13:30-19:00,Sa 09:00-1...",false,FRTCBE003955,2023-01-27,2023-03-03T17:35:31.203000
1789,50864,supervision-ev.france@totalenergies.com,RIESTER MEAUX,"[2.87930851314442, 48.94679007929618]",50 Rue François De Tessan 77100 Meaux,FRTCBP00702,RIESTER MEAUX,Parking privé à usage public,4,Accès libre,"Mo-Fr 08:30-12:00,Mo-Fr 13:30-19:00,Sa 09:00-1...",false,FRTCBE003954,2023-01-27,2023-03-03T17:35:31.203000


- exemple : une station avec plusieurs adresses -> erreur de saisie ?

In [23]:
itinerance_5.loc[itinerance_5.coordonneesXY	 == '[0.193942, 49.544211]', relations]

Unnamed: 0,index,contact_operateur,nom_enseigne,coordonneesXY,adresse_station,id_station_itinerance,nom_station,implantation_station,nbre_pdc,condition_acces,horaires,station_deux_roues,id_pdc_itinerance,date_maj,last_modified
83,1866,contact@ubitricity.com,Ubitricity France Network,"[0.193942, 49.544211]",Place Abbé Pierre,FRUBIE10056568,Centre ville - Montivilliers,Parking public,1,Accès libre,24/7,False,FRUBIE10056568,2023-01-18,2023-03-03T17:40:10.619000
1615,51263,contact@ubitricity.com,Ubitricity France Network,"[0.193942, 49.544211]",Place Abb� Pierre,FRUBIE10058428,Centre ville - Montivilliers,Parking public,1,Accès libre,24/7,False,FRUBIE10058428,2023-01-18,2023-03-03T16:22:10.908000


- exemple : une station avec plusieurs adresses -> erreur de saisie ?

In [24]:
itinerance_5.loc[itinerance_5.coordonneesXY	 == '[2.87930851314442, 48.94679007929618]', relations]

Unnamed: 0,index,contact_operateur,nom_enseigne,coordonneesXY,adresse_station,id_station_itinerance,nom_station,implantation_station,nbre_pdc,condition_acces,horaires,station_deux_roues,id_pdc_itinerance,date_maj,last_modified
1611,50861,supervision-ev.france@totalenergies.com,RIESTER MEAUX,"[2.87930851314442, 48.94679007929618]",52 Rue François De Tessan 77100 Meaux,FRTCBP00702,RIESTER MEAUX,Parking privé à usage public,4,Accès libre,"Mo-Fr 08:30-12:00,Mo-Fr 13:30-19:00,Sa 09:00-1...",False,FRTCBE003959,2023-01-27,2023-03-03T17:35:31.203000
1612,50862,supervision-ev.france@totalenergies.com,RIESTER MEAUX,"[2.87930851314442, 48.94679007929618]",52 Rue François De Tessan 77100 Meaux,FRTCBP00702,RIESTER MEAUX,Parking privé à usage public,4,Accès libre,"Mo-Fr 08:30-12:00,Mo-Fr 13:30-19:00,Sa 09:00-1...",False,FRTCBE003958,2023-01-27,2023-03-03T17:35:31.203000
1613,50863,supervision-ev.france@totalenergies.com,RIESTER MEAUX,"[2.87930851314442, 48.94679007929618]",51 Rue François De Tessan 77100 Meaux,FRTCBP00702,RIESTER MEAUX,Parking privé à usage public,4,Accès libre,"Mo-Fr 08:30-12:00,Mo-Fr 13:30-19:00,Sa 09:00-1...",False,FRTCBE003955,2023-01-27,2023-03-03T17:35:31.203000
1614,50864,supervision-ev.france@totalenergies.com,RIESTER MEAUX,"[2.87930851314442, 48.94679007929618]",50 Rue François De Tessan 77100 Meaux,FRTCBP00702,RIESTER MEAUX,Parking privé à usage public,4,Accès libre,"Mo-Fr 08:30-12:00,Mo-Fr 13:30-19:00,Sa 09:00-1...",False,FRTCBE003954,2023-01-27,2023-03-03T17:35:31.203000


### Cohérence station - coordonnées
- 216 pdc sont associés à des stations avec plusieurs coordonnées

In [25]:
itinerance_4.loc[~itinerance_4['coordonneesXY - id_station_itinerance'], relations][200:215]

Unnamed: 0,index,contact_operateur,nom_enseigne,coordonneesXY,adresse_station,id_station_itinerance,nom_station,implantation_station,nbre_pdc,condition_acces,horaires,station_deux_roues,id_pdc_itinerance,date_maj,last_modified
1408,44423,contact@evzen.com,Simone,"[4.427083,43.457513]",Rue Des Artisans - Borne 2 13460 SAINTES-MARIE...,FRS13PHT2TOP3OOS,"Stes-Maries-De-La-Mer, Rue Des Artisans",Voirie,4,Accès libre,24/7,False,FRS13EFMWB1,2022-04-26,2023-03-03T17:35:44.633000
1409,44424,contact@evzen.com,Simone,"[4.427083,43.457513]",Rue Des Artisans - Borne 2 13460 SAINTES-MARIE...,FRS13PHT2TOP3OOS,"Stes-Maries-De-La-Mer, Rue Des Artisans",Voirie,4,Accès libre,24/7,False,FRS13EFMWB2,2022-04-26,2023-03-03T17:35:44.633000
1458,47731,assistance.technique@tevgo.fr,Belib',"[2.3664377, 48.865765]",8 Boulevard Voltaire 75011 Paris,FRV75PPX1105,Paris | Boulevard Voltaire 8,Voirie,2,Accès libre,24/7,False,FRV75EPX11053,2022-12-16,2023-03-03T17:35:31.881000
1461,47735,assistance.technique@tevgo.fr,Belib',"[2.3664376, 48.8657658]",8 Boulevard Voltaire 75011 Paris,FRV75PPX1105,Paris | Boulevard Voltaire 8,Voirie,4,Accès libre,24/7,False,FRV75EPX11054,2022-12-16,2023-03-03T17:35:31.881000
1473,47763,assistance.technique@tevgo.fr,Belib',"[2.3664376, 48.8657658]",8 Boulevard Voltaire 75011 Paris,FRV75PPX1105,Paris | Boulevard Voltaire 8,Voirie,4,Accès libre,24/7,False,FRV75EPX11052,2022-12-16,2023-03-03T17:35:31.881000
1474,47764,assistance.technique@tevgo.fr,Belib',"[2.3664377, 48.865765]",8 Boulevard Voltaire 75011 Paris,FRV75PPX1105,Paris | Boulevard Voltaire 8,Voirie,2,Accès libre,24/7,False,FRV75EPX11051,2022-12-16,2023-03-03T17:35:31.881000
1555,48380,assistance.technique@tevgo.fr,Belib',"[2.3077698, 48.849297]",330 Avenue de SÃ©gur 75007 Paris,FRV75PPX0704,Paris | Avenue de SÃ©gur 55,Voirie,5,Accès libre,24/7,False,FRV75EPX07042,2022-12-16,2023-03-03T17:35:31.881000
1570,48414,assistance.technique@tevgo.fr,Belib',"[2.3077698, 48.849297]",330 Avenue de SÃ©gur 75007 Paris,FRV75PPX0704,Paris | Avenue de SÃ©gur 55,Voirie,5,Accès libre,24/7,False,FRV75EPX07045,2022-12-16,2023-03-03T17:35:31.881000
1571,48415,assistance.technique@tevgo.fr,Belib',"[2.3077698, 48.849297]",330 Avenue de SÃ©gur 75007 Paris,FRV75PPX0704,Paris | Avenue de SÃ©gur 55,Voirie,5,Accès libre,24/7,False,FRV75EPX07046,2022-12-16,2023-03-03T17:35:31.881000
1572,48427,assistance.technique@tevgo.fr,Belib',"[2.3036203, 48.869644]",248 Rue Pierre Charron 75008 Paris,FRV75PPX0801,Paris | Rue Pierre Charron 62,Voirie,3,Accès libre,24/7,False,FRV75EPX08011,2022-12-16,2023-03-03T17:35:31.881000


- exemple : une station avec plusieurs coordonnées -> incompréhension distinction station / pdc

In [26]:
itinerance_5.loc[itinerance_5.id_station_itinerance == 'FR073PCAMAIEUFR', relations]

Unnamed: 0,index,contact_operateur,nom_enseigne,coordonneesXY,adresse_station,id_station_itinerance,nom_station,implantation_station,nbre_pdc,condition_acces,horaires,station_deux_roues,id_pdc_itinerance,date_maj,last_modified
1169,42830,acelec@acelec-france.com,Camaïeu France,"[3.207246,50.68494]",211 Av. Jules Brame 59100 Roubaix,FR073PCAMAIEUFR,CAMAÏEU FRANCE,Parking privé à usage public,1,Accès libre,Mo-Su 08:00-08:00,False,FR073E8OV45243,2022-07-21,2023-03-03T17:36:21.752000
1170,42831,acelec@acelec-france.com,Camaïeu France,"[3.207306,50.684918]",211 Av. Jules Brame 59100 Roubaix,FR073PCAMAIEUFR,CAMAÏEU FRANCE,Parking privé à usage public,1,Accès libre,Mo-Su 08:00-08:00,False,FR073E0HKH51125,2022-07-21,2023-03-03T17:36:21.752000
1171,42832,acelec@acelec-france.com,Camaïeu France,"[3.207124,50.684984]",211 Av. Jules Brame 59100 Roubaix,FR073PCAMAIEUFR,CAMAÏEU FRANCE,Parking privé à usage public,1,Accès libre,Mo-Su 08:00-08:00,False,FR073EU6RQ5270,2022-07-21,2023-03-03T17:36:21.752000
1172,42833,acelec@acelec-france.com,Camaïeu France,"[3.207124,50.684984]",211 Av. Jules Brame 59100 Roubaix,FR073PCAMAIEUFR,CAMAÏEU FRANCE,Parking privé à usage public,1,Accès libre,Mo-Su 08:00-08:00,False,FR073EBEQA5957,2022-07-21,2023-03-03T17:36:21.752000
1173,42834,acelec@acelec-france.com,Camaïeu France,"[3.207047,50.685013]",211 Av. Jules Brame 59100 Roubaix,FR073PCAMAIEUFR,CAMAÏEU FRANCE,Parking privé à usage public,1,Accès libre,Mo-Su 08:00-08:00,False,FR073EMZLV5283,2022-07-21,2023-03-03T17:36:21.752000
1174,42835,acelec@acelec-france.com,Camaïeu France,"[3.207047,50.685013]",211 Av. Jules Brame 59100 Roubaix,FR073PCAMAIEUFR,CAMAÏEU FRANCE,Parking privé à usage public,1,Accès libre,Mo-Su 08:00-08:00,False,FR073EUHNJ5886,2022-07-21,2023-03-03T17:36:21.752000
1175,42836,acelec@acelec-france.com,Camaïeu France,"[3.206962,50.685049]",211 Av. Jules Brame 59100 Roubaix,FR073PCAMAIEUFR,CAMAÏEU FRANCE,Parking privé à usage public,1,Accès libre,Mo-Su 08:00-08:00,False,FR073EP9LD51287,2022-07-21,2023-03-03T17:36:21.752000
1176,42837,acelec@acelec-france.com,Camaïeu France,"[3.206962,50.685049]",211 Av. Jules Brame 59100 Roubaix,FR073PCAMAIEUFR,CAMAÏEU FRANCE,Parking privé à usage public,1,Accès libre,Mo-Su 08:00-08:00,False,FR073EXINB5826,2022-07-21,2023-03-03T17:36:21.752000
1179,42840,acelec@acelec-france.com,Camaïeu France,"[3.207246,50.68494]",211 Av. Jules Brame 59100 Roubaix,FR073PCAMAIEUFR,CAMAÏEU FRANCE,Parking privé à usage public,1,Accès libre,Mo-Su 08:00-08:00,False,FR073EYLF65474,2022-07-21,2023-03-03T17:36:21.752000
1180,42841,acelec@acelec-france.com,Camaïeu France,"[3.207187,50.684964]",211 Av. Jules Brame 59100 Roubaix,FR073PCAMAIEUFR,CAMAÏEU FRANCE,Parking privé à usage public,1,Accès libre,Mo-Su 08:00-08:00,False,FR073EP7QU5233,2022-07-21,2023-03-03T17:36:21.752000


- exemple : une station avec plusieurs coordonnées -> erreur de saisie

In [27]:
itinerance_5.loc[itinerance_5.id_station_itinerance == 'FRV75PPX0704', relations]

Unnamed: 0,index,contact_operateur,nom_enseigne,coordonneesXY,adresse_station,id_station_itinerance,nom_station,implantation_station,nbre_pdc,condition_acces,horaires,station_deux_roues,id_pdc_itinerance,date_maj,last_modified
1384,48380,assistance.technique@tevgo.fr,Belib',"[2.3077698, 48.849297]",330 Avenue de SÃ©gur 75007 Paris,FRV75PPX0704,Paris | Avenue de SÃ©gur 55,Voirie,5,Accès libre,24/7,False,FRV75EPX07042,2022-12-16,2023-03-03T17:35:31.881000
1399,48414,assistance.technique@tevgo.fr,Belib',"[2.3077698, 48.849297]",330 Avenue de SÃ©gur 75007 Paris,FRV75PPX0704,Paris | Avenue de SÃ©gur 55,Voirie,5,Accès libre,24/7,False,FRV75EPX07045,2022-12-16,2023-03-03T17:35:31.881000
1400,48415,assistance.technique@tevgo.fr,Belib',"[2.3077698, 48.849297]",330 Avenue de SÃ©gur 75007 Paris,FRV75PPX0704,Paris | Avenue de SÃ©gur 55,Voirie,5,Accès libre,24/7,False,FRV75EPX07046,2022-12-16,2023-03-03T17:35:31.881000
1445,48506,assistance.technique@tevgo.fr,Belib',"[2.3077698, 48.849297]",330 Avenue de SÃ©gur 75007 Paris,FRV75PPX0704,Paris | Avenue de SÃ©gur 55,Voirie,5,Accès libre,24/7,False,FRV75EPX07044,2022-12-16,2023-03-03T17:35:31.881000
1446,48507,assistance.technique@tevgo.fr,Belib',"[2.3077697, 48.8492973]",330 Avenue de Ségur 75007 Paris,FRV75PPX0704,Paris | Avenue de Ségur 55,Voirie,6,Accès libre,24/7,False,FRV75EPX07041,2022-12-16,2023-03-03T17:35:31.881000
1447,48509,assistance.technique@tevgo.fr,Belib',"[2.3077698, 48.849297]",330 Avenue de SÃ©gur 75007 Paris,FRV75PPX0704,Paris | Avenue de SÃ©gur 55,Voirie,5,Accès libre,24/7,False,FRV75EPX07043,2022-12-16,2023-03-03T17:35:31.881000


- exemple : deux stations avec une localisation identique mais deux adresses différentes (pb UTF8) + id identique entre station et pdc

In [28]:
itinerance_5.loc[itinerance_5.coordonneesXY	 == '[0.193942, 49.544211]', relations]

Unnamed: 0,index,contact_operateur,nom_enseigne,coordonneesXY,adresse_station,id_station_itinerance,nom_station,implantation_station,nbre_pdc,condition_acces,horaires,station_deux_roues,id_pdc_itinerance,date_maj,last_modified
83,1866,contact@ubitricity.com,Ubitricity France Network,"[0.193942, 49.544211]",Place Abbé Pierre,FRUBIE10056568,Centre ville - Montivilliers,Parking public,1,Accès libre,24/7,False,FRUBIE10056568,2023-01-18,2023-03-03T17:40:10.619000
1615,51263,contact@ubitricity.com,Ubitricity France Network,"[0.193942, 49.544211]",Place Abb� Pierre,FRUBIE10058428,Centre ville - Montivilliers,Parking public,1,Accès libre,24/7,False,FRUBIE10058428,2023-01-18,2023-03-03T16:22:10.908000


### Incohérence 'nbre_pdc'
- 25% des pdc ont un champ 'nbre_pdc' mal documenté

- exemple : station avec un pdc 'de regroupement' qui évite de documenter plusieurs lignes

In [29]:
itinerance_init.loc[itinerance_init.id_station_itinerance == 'FRLUMEACACIAS11', 
               ['id_pdc_itinerance', 'id_station_itinerance', 'coordonneesXY', 'nbre_pdc']]

Unnamed: 0,id_pdc_itinerance,id_station_itinerance,coordonneesXY,nbre_pdc
0,FRLUMEACACIAS11,FRLUMEACACIAS11,"[3.1485441,50.7582304]",4


- exemple : station avec plusieurs pdc mais l'id_station est identique à l'id_pdc

In [32]:
itinerance_init.loc[itinerance_init.coordonneesXY	 == '[2.451322, 45.66523]', 
                   ['id_pdc_itinerance', 'id_station_itinerance', 'coordonneesXY', 'nbre_pdc']]

Unnamed: 0,id_pdc_itinerance,id_station_itinerance,coordonneesXY,nbre_pdc
50616,FRSDGEMBDG512,FRSDGPMBDG512,"[2.451322, 45.66523]",2
50617,FRSDGEMBDG511,FRSDGPMBDG511,"[2.451322, 45.66523]",2


- exemple : station avec plusieurs pdc mais le champs a toujours une valeur de 1

In [31]:
itinerance_init.loc[itinerance_init.coordonneesXY	 == '[-1.7548354193520386, 48.125067030488154]', 
                   ['id_pdc_itinerance', 'id_station_itinerance', 'coordonneesXY', 'nbre_pdc']]

Unnamed: 0,id_pdc_itinerance,id_station_itinerance,coordonneesXY,nbre_pdc
1294,FRIENE35353A31,FRIENS35353A,"[-1.7548354193520386, 48.125067030488154]",1
1295,FRIENE35353A51,FRIENS35353A,"[-1.7548354193520386, 48.125067030488154]",1
1296,FRIENE35353A41,FRIENS35353A,"[-1.7548354193520386, 48.125067030488154]",1
1297,FRIENE35353A21,FRIENS35353A,"[-1.7548354193520386, 48.125067030488154]",1
1298,FRIENE35353A11,FRIENS35353A,"[-1.7548354193520386, 48.125067030488154]",1
