In [17]:
# Import des librairies
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

import re
import time

import psycopg2

from sqlalchemy import create_engine, inspect
from sqlalchemy import DATE, DATETIME, FLOAT, VARCHAR, INTEGER, DateTime

from sklearn.preprocessing import LabelEncoder

from tqdm import tqdm

import glob
import os

from unidecode import unidecode

In [1]:
!pwd

'pwd' n'est pas reconnu en tant que commande interne
ou externe, un programme ex‚cutable ou un fichier de commandes.


In [18]:
pd.set_option('display.max_row', 300)
pd.set_option('display.max_columns', 50)

folder = 'D:/Fichiers_dev/test_xml/tables/'
folder_export = 'D:/Fichiers_dev/test_xml/table2_analyse/'

In [19]:
# se positionner dans le répertoire où il y a mes fichiers
repertoire_table = os.chdir(folder)

liste_fichiers_tables = os.listdir(repertoire_table)
liste_fichiers_tables

# creation df avec les fichiers du dossier et leur taille

tailles_fichiers = []

for fichier in liste_fichiers_tables:
    tailles_fichiers.append(os.path.getsize(fichier))
    
dico = {'fichiers':liste_fichiers_tables,
       'tailles':tailles_fichiers}

fichiers_tailles = pd.DataFrame(dico)

# fichier classés par taille
fichiers_tailles = fichiers_tailles.sort_values('tailles', ascending=False)

# liste des plus gros fichiers
for fichier in fichiers_tailles['fichiers'].values[2:]:
    print(fichier)

ressources.csv
participationDirigeantDto.csv
declarations.csv
mandatElectifDto.csv
activProfCinqDerniereDto.csv
individus.csv
participationFinanciereDto.csv
activProfConjointDto.csv
fonctionBenevoleDto.csv
activCollaborateursDto.csv
attached_files.csv
observationInteretDto.csv
activConsultantDto.csv
comptesBancaireDto.csv
immeubleDto.csv
assuranceVieDto.csv
passifDto.csv
valeursEnBourseDto.csv
sciDto_immeubles.csv
sciDto.csv
vehiculeDto.csv
valeursNonEnBourseDto.csv
autreBienDto.csv
bienEtrangerDto.csv
observationPatrimoineDto.csv
bienDiverDto.csv
fondDto.csv


In [20]:
def mise_en_forme_colonnes(valeur):
    ''' Fonction qui modifie les colonnes pour pouvoir les utiliser comme champs de base de données sans avoir d'erreurs.
    - ajoute un "_" avant les majuscules,
    - transforme le tout en minuscule.'''
    
    valeur = re.sub(r'([A-Z])', r'_\1', valeur)
    valeur = valeur.lower()
    
    return valeur

In [21]:
def modification_date1(table, nom_colonne):
    '''Mise au format date'''
    # modification type date
    table[nom_colonne] = pd.to_datetime(table[nom_colonne], format='%d/%m/%Y')
    
    return table

In [22]:
def modification_date2(table, nom_colonne):
    '''Mise au format datetime'''
    # modification type date
    table[nom_colonne] = pd.to_datetime(table[nom_colonne], format='%d/%m/%Y %H:%M:%S')
    
    return table

In [23]:
def modification_date3(table, nom_colonne):
    '''Mise au format année'''
    # modification type date
    table[nom_colonne] = pd.to_datetime(table[nom_colonne], format='%Y')
    table[nom_colonne] = table[nom_colonne].dt.strftime('%Y')
    table[nom_colonne] = table[nom_colonne].astype('int64')
    
    return table

In [24]:
def modification_date4(table, nom_colonne):
    '''Mise au format mois année'''
    # modification type date
    table[nom_colonne] = pd.to_datetime(table[nom_colonne], format='%m/%Y')
    table[nom_colonne] = table[nom_colonne].dt.strftime('%Y-%m')

    return table

In [25]:
def modifications_pour_export(table, index):
    '''Modification colonne au format bdd et mise en place des index'''
    
    try :
        table = table[table['id'].notna()]
        
    except Exception as error :
        print (f"la colonne {error} n'existe pas dans la table.")
        
    try :
        table = table[table['montant'].notna()]
        
    except Exception as error2 :
        print (f"la colonne {error2} n'existe pas dans la table.")
        
    finally : 
        
            # mise en forme des colonnes pour sql
        table.columns = pd.Series(table.columns).apply(mise_en_forme_colonnes).values

        if 'id_declaration' in table.columns : table = table.sort_values('id_declaration')

            # création des index
        table.set_index([mise_en_forme_colonnes(valeur) for valeur in index], inplace=True)
    
    return table

In [26]:
def modif_nom(valeur):
    '''Enlève les accents et mets en majuscule.'''
    
    valeur = valeur.strip()
    # enlève les accents
    valeur = unidecode(valeur)
    valeur = valeur.upper()
    
    return valeur

## Modifications finales

### individus

In [27]:
individus = pd.read_csv(folder + 'individus.csv')
individus.head()

Unnamed: 0,civilite,codePostal,complement,dateNaissance,email,nom,pays,prenom,telephoneDec,ville,voie,id_individu
0,M.,[Données non publiées],[Données non publiées],29/07/1951,[Données non publiées],DELAPORTE,[Données non publiées],Olivier,[Données non publiées],[Données non publiées],[Données non publiées],1432
1,Mme,[Données non publiées],[Données non publiées],04/04/1964,[Données non publiées],SCHMITT,[Données non publiées],SYLVIE,[Données non publiées],[Données non publiées],[Données non publiées],4608
2,M.,[Données non publiées],[Données non publiées],26/06/1946,[Données non publiées],PELIEU,[Données non publiées],MICHEL,[Données non publiées],[Données non publiées],[Données non publiées],3921
3,Mme,[Données non publiées],[Données non publiées],14/03/1953,[Données non publiées],Gatel,[Données non publiées],Françoise,[Données non publiées],[Données non publiées],[Données non publiées],2308
4,Mme,[Données non publiées],[Données non publiées],30/11/1963,[Données non publiées],lecordier,[Données non publiées],nathalie,[Données non publiées],[Données non publiées],[Données non publiées],5611


In [28]:
individus['annee_naissance'] = individus['dateNaissance'].map(lambda x : x[-4:]).astype('int64')

In [29]:
# standardisation des civilité

individus.loc[individus['civilite']=='Mme.', 'civilite'] = 'Mme'
individus.loc[individus['civilite']=='M ', 'civilite'] = 'M.'

In [30]:
# standardisation des noms, prénoms

individus['nom'] = individus['nom'].apply(modif_nom)
individus['prenom'] = individus['prenom'].apply(modif_nom)

In [31]:
individus = modifications_pour_export(individus, index=['id_individu'])

la colonne 'id' n'existe pas dans la table.
la colonne 'montant' n'existe pas dans la table.


In [32]:
individus.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 5869 entries, 1432 to 449
Data columns (total 12 columns):
 #   Column           Non-Null Count  Dtype 
---  ------           --------------  ----- 
 0   civilite         5869 non-null   object
 1   code_postal      5865 non-null   object
 2   complement       5865 non-null   object
 3   date_naissance   5869 non-null   object
 4   email            5869 non-null   object
 5   nom              5869 non-null   object
 6   pays             5865 non-null   object
 7   prenom           5869 non-null   object
 8   telephone_dec    5865 non-null   object
 9   ville            5865 non-null   object
 10  voie             5865 non-null   object
 11  annee_naissance  5869 non-null   int64 
dtypes: int64(1), object(11)
memory usage: 596.1+ KB


### declarations

In [33]:
declarations = pd.read_csv(folder + 'declarations.csv')

In [34]:
# modification type date
declarations = modification_date2(declarations, 'date_depot')

In [35]:
declarations = modifications_pour_export(declarations, index=['id_declaration', 'id_individu'])
declarations.head()

la colonne 'id' n'existe pas dans la table.
la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,activ_collaborateurs_dto_neant,activ_consultant_dto_neant,activ_prof_cinq_derniere_dto_neant,activ_prof_conjoint_dto_neant,assurance_vie_dto_neant,autre_bien_dto_neant,bien_diver_dto_neant,bien_etranger_dto_neant,chiffre_affaire,complete,comptes_bancaire_dto_neant,date_debut_mandat,date_depot,declaration_modificative,declaration_version,evenement_majeur_dto_neant,fonction_benevole_dto_neant,fond_dto_neant,immeuble_dto_neant,mandat_electif_dto_neant,mandat_label,nom_societe,nom_societe_mere,observation_interet_dto_neant,observation_patrimoine_dto_neant,...,organe_nom_liste_organe,organe_organe_parent,origine,participation_dirigeant_dto_neant,participation_financiere_dto_neant,passif_dto_neant,qualite_declarant,qualite_declarant_for_p_d_f,qualite_mandat_cod_categorie_mandat,qualite_mandat_cod_type_mandat_fichier,qualite_mandat_code_liste_organe,qualite_mandat_label_organe,qualite_mandat_label_type_mandat,qualite_mandat_nom_categorie_mandat,qualite_mandat_type_mandat,regime_matrimonial,regime_matrimonial_comments,revenu_mandat_dto_neant,sci_dto_neant,type_declaration_id,type_declaration_label,uuid,valeurs_en_bourse_dto_neant,valeurs_non_en_bourse_dto_neant,vehicule_dto_neant
id_declaration,id_individu,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1,Unnamed: 40_level_1,Unnamed: 41_level_1,Unnamed: 42_level_1,Unnamed: 43_level_1,Unnamed: 44_level_1,Unnamed: 45_level_1,Unnamed: 46_level_1,Unnamed: 47_level_1,Unnamed: 48_level_1,Unnamed: 49_level_1,Unnamed: 50_level_1,Unnamed: 51_level_1,Unnamed: 52_level_1
0,1432,False,True,False,True,,,,,,True,,15/03/2020,2021-02-08 19:58:13,False,20171221.0,,True,,,False,Elu local ou membre d’un établissement public ...,,,True,,...,,,ADEL,True,True,,,Membre d’EPCI/Versailles grand parc,LOC,epci,,EPCI,Membre d’EPCI,Elu local ou membre d’EPCI,Membre d’EPCI,,,,,DI,Déclaration d'intérêts,000765d9-da68-48c6-a95d-f34a12cacb5f,,,
1,4608,False,True,False,False,,,,,,True,,28/06/2020,2020-08-17 19:27:35,,20171221.0,,True,,,True,Elu local ou membre d’un établissement public ...,,,True,,...,Communes +20KH,,ADEL,True,True,,ADJOINT EDUCATION ENFANCE JEUNESSE,Maire ou adjoint municipal/Bordeaux (33)/ADJOI...,LOC,commune,COMM,Commune,Maire ou adjoint municipal,Elu local ou membre d’EPCI,Maire ou adjoint municipal,,,,,DI,Déclaration d'intérêts,00138e83-44ec-4da1-89f3-37d2309a62a2,,,
2,3921,False,True,False,False,,,,,,True,,01/07/2021,2021-11-22 16:19:31,True,20171221.0,,True,,,False,Membre ou dirigeant d’une autorité administrat...,,,False,,...,,,ADEL,False,True,,PRESIDENT DU CONSEIL GENERAL,PRESIDENT DU CONSEIL GENERAL,AAI,aai,AAI,AAI,,Membre d’une AAI,Membre,,,,,DI,Déclaration d'intérêts modificative,0014115c-cbae-4bdd-98d1-39c8e6062095,,,
3,2308,False,True,True,False,,,,,,True,,28/09/2014,2021-02-24 10:25:03,True,20171221.0,,False,,,False,Député ou sénateur,,,False,,...,Zones d'élection des parlementaires,,ADEL,True,False,,,Sénateur/Ille-et-Vilaine(35),PAR,senateur,ZEP,Département d'élection,Sénateur,Député ou sénateur,Sénateur,,,,,DIA,Déclaration d'intérêts et d'activités modifica...,0020c869-c893-40ff-b7c4-42aeb8f6d1c0,,,
4,5611,False,True,False,True,,,,,,True,,26/06/2021,2021-09-01 10:38:28,True,20171221.0,,False,,,False,Elu local ou membre d’un établissement public ...,,,True,,...,Départements,28.0,ADEL,False,True,,,Elu départemental/Seine-Maritime (76),LOC,departement,DEP,Département,Elu départemental,Elu local ou membre d’EPCI,Elu départemental,,,,,DI,Déclaration d'intérêts modificative,00243ad5-2191-4efc-884b-df9213413b17,,,


In [36]:
declarations.info()

<class 'pandas.core.frame.DataFrame'>
MultiIndex: 10874 entries, (0, 1432) to (10873, 3741)
Data columns (total 54 columns):
 #   Column                                  Non-Null Count  Dtype         
---  ------                                  --------------  -----         
 0   activ_collaborateurs_dto_neant          10787 non-null  object        
 1   activ_consultant_dto_neant              10787 non-null  object        
 2   activ_prof_cinq_derniere_dto_neant      10787 non-null  object        
 3   activ_prof_conjoint_dto_neant           10787 non-null  object        
 4   assurance_vie_dto_neant                 87 non-null     object        
 5   autre_bien_dto_neant                    87 non-null     object        
 6   bien_diver_dto_neant                    87 non-null     object        
 7   bien_etranger_dto_neant                 87 non-null     object        
 8   chiffre_affaire                         5 non-null      float64       
 9   complete                          

### ressources

In [37]:
ressources = pd.read_csv(folder + 'ressources.csv')
ressources.head()

Unnamed: 0,id_declaration,id_activite,id_ressource,annee,montant
0,0,m8012,34173,2020,6556
1,0,m8013,34174,2020,3180
2,2,m21205,89421,2012,0
3,2,m21205,89422,2013,7200
4,2,m21205,89423,2014,5820


In [38]:
# modification type année
ressources = modification_date3(ressources, 'annee')

In [39]:
# table de remplacement
remplacements = {
    '\xa0':'',
    ' ':'',
    ',':'.',
    'XXX': 'nan'
}

In [40]:
# suppression de l'espace 'insécable' unicode '\xa0' et conversion en 'int64'
for key, value in remplacements.items():
    ressources['montant'] = ressources['montant'].str.replace(key, value)

In [41]:
# conversion montant en float
ressources['montant'] = ressources['montant'].astype('float').round()

In [42]:
ressources['id_activite'].map(lambda x : x[0]).unique()

array(['m', 'd', 'c', 'p'], dtype=object)

In [43]:
def origine_ressource(valeur):
    
    if valeur == 'm' : return 'mandatElectifDto'
    if valeur == 'd' : return 'participationDirigeantDto'
    if valeur == 'c' : return 'activConsultantDto'
    if valeur == 'p' : return 'activProfCinqDerniereDto'

In [44]:
# creation colonne origine ressources
ressources['origine_ressource'] = ressources['id_activite'].map(lambda x : x[0]).apply(origine_ressource)

In [45]:
ressources = modifications_pour_export(ressources, index=['id_declaration', 'id_activite', 'id_ressource'])

la colonne 'id' n'existe pas dans la table.


In [46]:
ressources.head()

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,annee,montant,origine_ressource
id_declaration,id_activite,id_ressource,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
0,m8012,34173,2020,6556.0,mandatElectifDto
0,m8013,34174,2020,3180.0,mandatElectifDto
0,p3950,399330,2020,25867.0,activProfCinqDerniereDto
1,p11886,429198,2015,6362.0,activProfCinqDerniereDto
1,p11886,429199,2016,6698.0,activProfCinqDerniereDto


### participationDirigeantDto

In [47]:
participationDirigeantDto = pd.read_csv(folder + 'participationDirigeantDto.csv')
participationDirigeantDto.head()

Unnamed: 0,id_declaration,id_dirigeant,activite,brutNet,commentaire,conservee,dateDebut,dateFin,id,label,nomSociete
0,2,d39447,Président,Brut,PAS DE REMUNERATION,,01/2012,07/2017,CREATION,,SEMAP
1,2,d39448,Président,Brut,Pas de rémunération,,01/2012,07/2017,CREATION,,SEMIP
2,2,d39449,Président,Brut,Pas de rémunération,,01/2012,07/2017,CREATION,,SEM N'PY
3,2,d39450,Président,Brut,Pas de rémunération,,01/2012,07/2017,CREATION,,SPL BALNEA
4,2,d39451,PRESIDENT,Brut,PAS DE REMUNERATION PAS DE GRATIFICATION,,01/2011,12/2016,CREATION,,PROMODEF


In [48]:
participationDirigeantDto = modification_date4(participationDirigeantDto, 'dateDebut')
participationDirigeantDto = modification_date4(participationDirigeantDto, 'dateFin')

In [49]:
participationDirigeantDto.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 52220 entries, 0 to 52219
Data columns (total 11 columns):
 #   Column          Non-Null Count  Dtype 
---  ------          --------------  ----- 
 0   id_declaration  52220 non-null  int64 
 1   id_dirigeant    52220 non-null  object
 2   activite        52220 non-null  object
 3   brutNet         52087 non-null  object
 4   commentaire     19339 non-null  object
 5   conservee       8728 non-null   object
 6   dateDebut       52220 non-null  object
 7   dateFin         28157 non-null  object
 8   id              52220 non-null  object
 9   label           631 non-null    object
 10  nomSociete      52196 non-null  object
dtypes: int64(1), object(10)
memory usage: 4.4+ MB


In [50]:
participationDirigeantDto = modifications_pour_export(participationDirigeantDto, index=['id_declaration', 'id_dirigeant'])

la colonne 'montant' n'existe pas dans la table.


In [51]:
participationDirigeantDto.head()

Unnamed: 0_level_0,Unnamed: 1_level_0,activite,brut_net,commentaire,conservee,date_debut,date_fin,id,label,nom_societe
id_declaration,id_dirigeant,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
2,d39447,Président,Brut,PAS DE REMUNERATION,,2012-01,2017-07,CREATION,,SEMAP
2,d39448,Président,Brut,Pas de rémunération,,2012-01,2017-07,CREATION,,SEMIP
2,d39449,Président,Brut,Pas de rémunération,,2012-01,2017-07,CREATION,,SEM N'PY
2,d39450,Président,Brut,Pas de rémunération,,2012-01,2017-07,CREATION,,SPL BALNEA
2,d39451,PRESIDENT,Brut,PAS DE REMUNERATION PAS DE GRATIFICATION,,2011-01,2016-12,CREATION,,PROMODEF


### mandatElectifDto

In [52]:
mandatElectifDto = pd.read_csv(folder + 'mandatElectifDto.csv')
mandatElectifDto.head()

Unnamed: 0,id_declaration,id_mandat,brutNet,commentaire,conservee,dateDebut,dateFin,descriptionMandat,id,label,neant
0,0,m8012,Net,Somme des montants nets avant impôts des mois ...,,03/2020,05/2020,Maire de La Celle Saint-Cloud,CREATION,,
1,0,m8013,Net,Somme des montants nets avant impôts des mois ...,,03/2020,05/2020,Vice-président de la communauté d'agglomératio...,CREATION,,False
2,1,m24919,,,,,,,,,True
3,2,m21205,Brut,,,01/2012,07/2017,VICE PRESIDENT D'UN SYNDICAT D'ELECTRIFICATION,CREATION,,
4,2,m21206,Brut,,,01/2013,12/2016,PRESIDENT DU CONSEIL GENERAL,CREATION,,


In [53]:
mandatElectifDto = modification_date4(mandatElectifDto, 'dateDebut')
mandatElectifDto = modification_date4(mandatElectifDto, 'dateFin')

In [54]:
mandatElectifDto = modifications_pour_export(mandatElectifDto, index=['id_declaration', 'id_mandat'])

la colonne 'montant' n'existe pas dans la table.


In [55]:
mandatElectifDto.head()

Unnamed: 0_level_0,Unnamed: 1_level_0,brut_net,commentaire,conservee,date_debut,date_fin,description_mandat,id,label,neant
id_declaration,id_mandat,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
0,m8012,Net,Somme des montants nets avant impôts des mois ...,,2020-03,2020-05,Maire de La Celle Saint-Cloud,CREATION,,
0,m8013,Net,Somme des montants nets avant impôts des mois ...,,2020-03,2020-05,Vice-président de la communauté d'agglomératio...,CREATION,,False
2,m21214,Net,PRESIDENT DU SYNDICAT THERMAL ET TOURISTIQUE 2...,,2017-01,2021-06,PRESIDENT D'UN SYNDICAT DE COMMUNES,CREATION,,
2,m21213,Net,PRESIDENT SIVAL Communauté de communes transfo...,,2017-01,2021-06,PRESIDENT D'UN SYNDICAT DE COMMUNES,CREATION,,
2,m21212,Net,pour 2019 2020 et 2021 montants net imposables...,,2017-01,2021-06,ADJOINT MAIRIE,CREATION,,


### activProfCinqDerniereDto

In [56]:
activProfCinqDerniereDto = pd.read_csv(folder + 'activProfCinqDerniereDto.csv')
activProfCinqDerniereDto.head()

Unnamed: 0,id_declaration,id_activProfCinqDerniereDto,brutNet,commentaire,conservee,dateDebut,dateFin,description,employeur,id,label
0,0,p3950,Net,Somme des Net à payer avant impôt des mois de ...,,03/2020,05/2020,Conseiller maître,Cour des comptes,CREATION,
1,1,p11886,Net,,,01/2015,04/2018,CONSULTANTE FORMATRICE,EXPANSIAL,CREATION,
2,2,p10258,Net,RETRAITE FONCTION PUBLIQUE DEPUIS 2001,,01/2012,12/2016,Conducteur de travaux DDE,FONCTION PUBLIQUE DE L'ETAT,CREATION,
3,2,p10259,Net,RETRAITE DEPUIS 2001,,01/2017,12/2017,conducteur de travaux DDE,FONCTION PUBLIQUE DE L'ETAT,CREATION,
4,2,p10260,Net,RETRAITE,,01/2018,12/2018,conducteur de travaux DDE,FONCTION PUBLIQUE DE L'ETAT,CREATION,


In [57]:
activProfCinqDerniereDto.rename(columns={'idactivProfCinqDerniereDto' : 'id_activProfCinqDerniereDto'}, inplace=True)

In [58]:
activProfCinqDerniereDto = modification_date4(activProfCinqDerniereDto, 'dateDebut')
activProfCinqDerniereDto = modification_date4(activProfCinqDerniereDto, 'dateFin')

In [59]:
activProfCinqDerniereDto = modifications_pour_export(activProfCinqDerniereDto, index=['id_declaration', 'id_activProfCinqDerniereDto'])

la colonne 'montant' n'existe pas dans la table.


In [60]:
activProfCinqDerniereDto.head()

Unnamed: 0_level_0,Unnamed: 1_level_0,brut_net,commentaire,conservee,date_debut,date_fin,description,employeur,id,label
id_declaration,id_activ_prof_cinq_derniere_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
0,p3950,Net,Somme des Net à payer avant impôt des mois de ...,,2020-03,2020-05,Conseiller maître,Cour des comptes,CREATION,
1,p11886,Net,,,2015-01,2018-04,CONSULTANTE FORMATRICE,EXPANSIAL,CREATION,
2,p10258,Net,RETRAITE FONCTION PUBLIQUE DEPUIS 2001,,2012-01,2016-12,Conducteur de travaux DDE,FONCTION PUBLIQUE DE L'ETAT,CREATION,
2,p10259,Net,RETRAITE DEPUIS 2001,,2017-01,2017-12,conducteur de travaux DDE,FONCTION PUBLIQUE DE L'ETAT,CREATION,
2,p10260,Net,RETRAITE,,2018-01,2018-12,conducteur de travaux DDE,FONCTION PUBLIQUE DE L'ETAT,CREATION,


### participationFinanciereDto

In [61]:
participationFinanciereDto = pd.read_csv(folder + 'participationFinanciereDto.csv')
participationFinanciereDto.head(2)

Unnamed: 0,id_declaration,idparticipationFinanciereDto,actiConseil,capitalDetenu,commentaire,evaluation,id,label,nomOrganisationConseil,nomSociete,nombreParts,remuneration
0,3,4154,Non,,,12200,CREATION,,,PLURIEL VALEURS 4,151.0,9097.14 €
1,3,4155,Non,,,4047,CREATION,,,Nouvelles Parts Sociales B,4047.0,47 €


In [62]:
participationFinanciereDto.rename(columns={'idparticipationFinanciereDto' : 'id_participationFinanciereDto'}, inplace=True)

In [63]:
participationFinanciereDto = modifications_pour_export(participationFinanciereDto, index=['id_declaration', 'id_participationFinanciereDto'])

la colonne 'montant' n'existe pas dans la table.


In [64]:
participationFinanciereDto.head()

Unnamed: 0_level_0,Unnamed: 1_level_0,acti_conseil,capital_detenu,commentaire,evaluation,id,label,nom_organisation_conseil,nom_societe,nombre_parts,remuneration
id_declaration,id_participation_financiere_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
3,4154,Non,,,12200,CREATION,,,PLURIEL VALEURS 4,151.0,9097.14 €
3,4155,Non,,,4047,CREATION,,,Nouvelles Parts Sociales B,4047.0,47 €
5,2703,,,,1200,CREATION,,,La Coopérative Tiers-Lieux,24.0,parts sociales de scic non rémunérées
5,2704,,,,2400,CREATION,,,Coop'Alpha,48.0,parts sociales de Scop SA non rémunérées
7,3362,,5.0,Il s'agit d'une SCI immobilière qui loue le bi...,9600,CREATION,,,SCI [Données non publiées],21.0,88 € en 2020. Environ 600 à 700 € en 2021.


In [65]:
participationFinanciereDto.info()

<class 'pandas.core.frame.DataFrame'>
MultiIndex: 10988 entries, (3, 4154) to (10871, 970)
Data columns (total 10 columns):
 #   Column                    Non-Null Count  Dtype  
---  ------                    --------------  -----  
 0   acti_conseil              2731 non-null   object 
 1   capital_detenu            6998 non-null   float64
 2   commentaire               4804 non-null   object 
 3   evaluation                10988 non-null  int64  
 4   id                        10988 non-null  object 
 5   label                     155 non-null    object 
 6   nom_organisation_conseil  85 non-null     object 
 7   nom_societe               10988 non-null  object 
 8   nombre_parts              10987 non-null  float64
 9   remuneration              10982 non-null  object 
dtypes: float64(2), int64(1), object(7)
memory usage: 1.4+ MB


### activProfConjointDto

In [66]:
activProfConjointDto = pd.read_csv(folder + 'activProfConjointDto.csv')
activProfConjointDto.head()

Unnamed: 0,id_declaration,id_activProfConjointDto,activiteProf,commentaire,employeurConjoint,id,label,nomConjoint
0,1,7001,[Données non publiées],,dekra,CREATION,,[Données non publiées]
1,2,5982,[Données non publiées],[Données non publiées],SAS SLTS,CREATION,,[Données non publiées]
2,3,3122,Retraité,,Retraité,CREATION,,[Données non publiées]
3,5,2000,Chargé de mission,,Région Nouvelle-Aquitaine,CREATION,,[Données non publiées]
4,6,4433,retraitée,[Données non publiées],NEANT,CREATION,,[Données non publiées]


In [67]:
activProfConjointDto = modifications_pour_export(activProfConjointDto, index=['id_declaration', 'id_activProfConjointDto'])

la colonne 'montant' n'existe pas dans la table.


In [68]:
activProfConjointDto.head()

Unnamed: 0_level_0,Unnamed: 1_level_0,activite_prof,commentaire,employeur_conjoint,id,label,nom_conjoint
id_declaration,id_activ_prof_conjoint_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
1,7001,[Données non publiées],,dekra,CREATION,,[Données non publiées]
2,5982,[Données non publiées],[Données non publiées],SAS SLTS,CREATION,,[Données non publiées]
3,3122,Retraité,,Retraité,CREATION,,[Données non publiées]
5,2000,Chargé de mission,,Région Nouvelle-Aquitaine,CREATION,,[Données non publiées]
6,4433,retraitée,[Données non publiées],NEANT,CREATION,,[Données non publiées]


In [69]:
activProfConjointDto.info()

<class 'pandas.core.frame.DataFrame'>
MultiIndex: 7907 entries, (1, 7001) to (10872, 2399)
Data columns (total 6 columns):
 #   Column              Non-Null Count  Dtype 
---  ------              --------------  ----- 
 0   activite_prof       7907 non-null   object
 1   commentaire         1886 non-null   object
 2   employeur_conjoint  7906 non-null   object
 3   id                  7907 non-null   object
 4   label               176 non-null    object
 5   nom_conjoint        7901 non-null   object
dtypes: object(6)
memory usage: 1.0+ MB


### fonctionBenevoleDto

In [70]:
fonctionBenevoleDto = pd.read_csv(folder + 'fonctionBenevoleDto.csv')
fonctionBenevoleDto.head()

Unnamed: 0,id_declaration,idfonctionBenevoleDto,commentaire,conservee,descriptionActivite,id,label,nomStructure
0,3,1821,,True,Présidente,CREATION,,Petites cités de caractère de Bretagne
1,3,1822,,True,Présidente,CREATION,,Petites cités de caractère de France
2,3,1823,,True,Vice-présidente et trésorière,CREATION,,France Patrimoines et Territoires d’Exception
3,4,2590,compétence du Département,False,directrice d'une association quiaccompagne les...,CREATION,,directrice du CIDFF (centre d'information sur ...
4,7,1478,Voir rubrique 3 (participations à des organes ...,,Présidente,CREATION,,Orchestre français des jeunes


In [71]:
fonctionBenevoleDto.rename(columns={'idfonctionBenevoleDto' : 'id_fonctionBenevoleDto'}, inplace=True)

In [72]:
fonctionBenevoleDto = modifications_pour_export(fonctionBenevoleDto, index=['id_declaration', 'id_fonctionBenevoleDto'])
fonctionBenevoleDto.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,commentaire,conservee,description_activite,id,label,nom_structure
id_declaration,id_fonction_benevole_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
3,1821,,True,Présidente,CREATION,,Petites cités de caractère de Bretagne
3,1822,,True,Présidente,CREATION,,Petites cités de caractère de France
3,1823,,True,Vice-présidente et trésorière,CREATION,,France Patrimoines et Territoires d’Exception
4,2590,compétence du Département,False,directrice d'une association quiaccompagne les...,CREATION,,directrice du CIDFF (centre d'information sur ...
7,1478,Voir rubrique 3 (participations à des organes ...,,Présidente,CREATION,,Orchestre français des jeunes


### activCollaborateursDto

In [73]:
activCollaborateursDto = pd.read_csv(folder + 'activCollaborateursDto.csv')
activCollaborateursDto.head()

Unnamed: 0,id_declaration,idactivCollaborateursDto,commentaire,descriptionActivite,employeur,id,label,nom
0,3,2192,,Collaboratrice en circonscription,,CREATION,,Véronique Bouchet
1,3,2193,,Collaborateur au Sénat,,CREATION,,Romain Brutinaud
2,10,3190,,,NÉANT,CREATION,,PIGNOL Catherine
3,10,3191,conseiller municipal à Villepreux,,,CREATION,,SEVIN-MONTEL Sylvie
4,12,4348,,,néant,CREATION,,Cœur-Joly Marylène


In [74]:
activCollaborateursDto.rename(columns={'idactivCollaborateursDto' : 'id_activCollaborateursDto'}, inplace=True)

In [75]:
activCollaborateursDto = modifications_pour_export(activCollaborateursDto, index=['id_declaration', 'id_activCollaborateursDto'])
activCollaborateursDto.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,commentaire,description_activite,employeur,id,label,nom
id_declaration,id_activ_collaborateurs_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
3,2192,,Collaboratrice en circonscription,,CREATION,,Véronique Bouchet
3,2193,,Collaborateur au Sénat,,CREATION,,Romain Brutinaud
10,3190,,,NÉANT,CREATION,,PIGNOL Catherine
10,3191,conseiller municipal à Villepreux,,,CREATION,,SEVIN-MONTEL Sylvie
12,4348,,,néant,CREATION,,Cœur-Joly Marylène


### attached_files

In [76]:
attached_files = pd.read_csv(folder + 'attached_files.csv')
attached_files.head()

Unnamed: 0,id_file,id_declaration,fileName,serverFileName
0,0,2914,VUE_PDF_DU_RECEPISSE_DU_DEPOT_XML,
1,1,10647,VUE_PDF_DU_RECEPISSE_DU_DEPOT_XML,
2,2,1458,VUE_PDF_DU_RECEPISSE_DU_DEPOT_XML,
3,3,8289,VUE_PDF_DU_RECEPISSE_DU_DEPOT_XML,
4,4,7293,VUE_PDF_DU_RECEPISSE_DU_DEPOT_XML,


In [77]:
attached_files = modifications_pour_export(attached_files, index=['id_declaration', 'id_file'])
attached_files.head()

la colonne 'id' n'existe pas dans la table.
la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,file_name,server_file_name
id_declaration,id_file,Unnamed: 2_level_1,Unnamed: 3_level_1
0,3602,declaration-42c9b4c0-0925-4ff1-b5ab-1725cbdae3...,
0,3605,,000765d9-da68-48c6-a95d-f34a12cacb5f_pj02
0,3606,VUE_PDF_DU_RECEPISSE_DU_DEPOT_XML,
0,3603,,000765d9-da68-48c6-a95d-f34a12cacb5f_pj01
0,3604,declaration-e5c38ca1-ae41-4568-8c6a-76fa7351b4...,


### observationInteretDto

In [78]:
observationInteretDto = pd.read_csv(folder + 'observationInteretDto.csv')
observationInteretDto.head()

Unnamed: 0,id_declaration,idobservationInteretDto,contenu,id,label
0,2,1345,2019 - impôt prélevé à la source - abattement ...,CREATION,
1,3,683,[Données non publiées],CREATION,
2,9,1134,[Données non publiées],CREATION,
3,16,703,Maire de 2008 à 2014; 33% de l'indice maxMaire...,CREATION,
4,20,1464,[Données non publiées],CREATION,


In [79]:
observationInteretDto.rename(columns={'idobservationInteretDto' : 'id_observationInteretDto'}, inplace=True)

In [80]:
observationInteretDto = modifications_pour_export(observationInteretDto, index=['id_declaration', 'id_observationInteretDto'])
observationInteretDto.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,contenu,id,label
id_declaration,id_observation_interet_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
2,1345,2019 - impôt prélevé à la source - abattement ...,CREATION,
3,683,[Données non publiées],CREATION,
9,1134,[Données non publiées],CREATION,
16,703,Maire de 2008 à 2014; 33% de l'indice maxMaire...,CREATION,
20,1464,[Données non publiées],CREATION,


### activConsultantDto

In [81]:
activConsultantDto = pd.read_csv(folder + 'activConsultantDto.csv')
activConsultantDto.head()

Unnamed: 0,id_declaration,id_activConsultantDto,brutNet,commentaire,conservee,dateDebut,dateFin,description,id,label,nomEmployeur
0,5,c332,Net,,,11/2020,11/2021,Conseil aux organisations,CREATION,,Smart
1,9,c859,Net,Je suis encore salarié et associé AIR coop en ...,,01/2014,07/2020,Conseil stratégie responsabilité sociétale,CREATION,,AIR coop
2,20,c1139,Brut,[Données non publiées],,10/2018,07/2020,Conseils,CREATION,,AUTOENTREPRENEUR
3,41,c815,Net,c 'est 10 conseils avec les commissions par an...,,01/2018,09/2020,administratrice du conseil,CREATION,,cgss de la reunion
4,41,c816,Net,en tant que présidente du gfa je perçois un qu...,,01/2016,09/2020,presidente,CREATION,,gfa [Données non publiées]


In [82]:
activConsultantDto.rename(columns={'idactivConsultantDto' : 'id_activConsultantDto'}, inplace=True)

In [83]:
activConsultantDto = modification_date4(activConsultantDto, 'dateDebut')
activConsultantDto = modification_date4(activConsultantDto, 'dateFin')

In [84]:
activConsultantDto = modifications_pour_export(activConsultantDto, index=['id_declaration', 'id_activConsultantDto'])
activConsultantDto.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,brut_net,commentaire,conservee,date_debut,date_fin,description,id,label,nom_employeur
id_declaration,id_activ_consultant_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
5,c332,Net,,,2020-11,2021-11,Conseil aux organisations,CREATION,,Smart
9,c859,Net,Je suis encore salarié et associé AIR coop en ...,,2014-01,2020-07,Conseil stratégie responsabilité sociétale,CREATION,,AIR coop
20,c1139,Brut,[Données non publiées],,2018-10,2020-07,Conseils,CREATION,,AUTOENTREPRENEUR
41,c815,Net,c 'est 10 conseils avec les commissions par an...,,2018-01,2020-09,administratrice du conseil,CREATION,,cgss de la reunion
41,c816,Net,en tant que présidente du gfa je perçois un qu...,,2016-01,2020-09,presidente,CREATION,,gfa [Données non publiées]


### comptesBancaireDto

In [85]:
comptesBancaireDto = pd.read_csv(folder + 'comptesBancaireDto.csv')
comptesBancaireDto.head()

Unnamed: 0,id_declaration,idcomptesBancaireDto,commentaire,conservee,etablissement,id,label,numeroCompte,titulaire,typeCompte,valeur
0,251,195,,,CEIDF- [Données non publiées],CREATION,,[Données non publiées],Dujols Dominique,Livret A,2201
1,251,196,,,CEIDF- [Données non publiées],CREATION,,[Données non publiées],Dujols Dominique,LDD,33
2,251,197,,,CEIDF- [Données non publiées],CREATION,,[Données non publiées],Dominique DUJOLS,LEL,306
3,251,198,solde au 27 janvier 2022,,CEIDF- [Données non publiées],CREATION,,[Données non publiées],Dujols Dominique,Compte courant,113
4,251,199,,,CEIDF- [Données non publiées],CREATION,,[Données non publiées],Dujols Dominique,Compte espèces-PEA Numéraire,2


In [86]:
comptesBancaireDto.rename(columns={'idcomptesBancaireDto' : 'id_comptesBancaireDto'}, inplace=True)

In [87]:
comptesBancaireDto = modifications_pour_export(comptesBancaireDto, index=['id_declaration', 'id_comptesBancaireDto'])
comptesBancaireDto.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,commentaire,conservee,etablissement,id,label,numero_compte,titulaire,type_compte,valeur
id_declaration,id_comptes_bancaire_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
251,195,,,CEIDF- [Données non publiées],CREATION,,[Données non publiées],Dujols Dominique,Livret A,2201
251,196,,,CEIDF- [Données non publiées],CREATION,,[Données non publiées],Dujols Dominique,LDD,33
251,197,,,CEIDF- [Données non publiées],CREATION,,[Données non publiées],Dominique DUJOLS,LEL,306
251,198,solde au 27 janvier 2022,,CEIDF- [Données non publiées],CREATION,,[Données non publiées],Dujols Dominique,Compte courant,113
251,199,,,CEIDF- [Données non publiées],CREATION,,[Données non publiées],Dujols Dominique,Compte espèces-PEA Numéraire,2


In [88]:
comptesBancaireDto.info()

<class 'pandas.core.frame.DataFrame'>
MultiIndex: 661 entries, (251, 195) to (10593, 347)
Data columns (total 9 columns):
 #   Column         Non-Null Count  Dtype 
---  ------         --------------  ----- 
 0   commentaire    190 non-null    object
 1   conservee      240 non-null    object
 2   etablissement  661 non-null    object
 3   id             661 non-null    object
 4   label          34 non-null     object
 5   numero_compte  661 non-null    object
 6   titulaire      661 non-null    object
 7   type_compte    661 non-null    object
 8   valeur         661 non-null    int64 
dtypes: int64(1), object(8)
memory usage: 72.6+ KB


### immeubleDto

In [89]:
immeubleDto = pd.read_csv(folder + 'immeubleDto.csv')
immeubleDto.head()

Unnamed: 0,id_declaration,idimmeubleDto,adresse,codePostal,commentaire,conservee,dateAcquisition,droitReel,id,label,localite,nature,origine,prixAcquisition,prixTravaux,quotePart,regimeJuridique,superficieBati,superficieNonBati,valeurVenale
0,251,58,[Données non publiées],[Données non publiées] (Département : 75),[Données non publiées],,1994,Pleine propriété,CREATION,,[Données non publiées],Appartement,Acquisition,304924,30000.0,100.0,Bien propre,91,0.0,1210000
1,251,59,[Données non publiées],[Données non publiées] (Département : 12),[Données non publiées],,2015,Usufruit,CREATION,,[Données non publiées],Maison,Acquisition,178000,20000.0,100.0,Bien indivis,225,0.0,70000
2,251,60,[Données non publiées],[Données non publiées] (Département : 75),[Données non publiées],,2022,Usufruit,CREATION,,[Données non publiées],Garage,Acquisition,30000,,100.0,Bien indivis,0,0.001,12000
3,267,147,[Données non publiées],[Données non publiées] (Département : 64),La valeur vénale déclarée correspond à ma part...,False,2000,Nue-propriété,CREATION,,[Données non publiées],Maison individuelle,Acquisition,600000,,16.0,Bien indivis,310,0.7,150000
4,433,18,[Données non publiées],[Données non publiées] (Département : 42),[Données non publiées],False,2014,Pleine propriété,CREATION,,[Données non publiées],Appartement,Succession,21250,,25.0,Bien indivis,126,0.0,34452


In [90]:
immeubleDto.rename(columns={'idimmeubleDto' : 'id_immeubleDto'}, inplace=True)

In [91]:
immeubleDto.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 234 entries, 0 to 233
Data columns (total 20 columns):
 #   Column             Non-Null Count  Dtype  
---  ------             --------------  -----  
 0   id_declaration     234 non-null    int64  
 1   id_immeubleDto     234 non-null    int64  
 2   adresse            234 non-null    object 
 3   codePostal         234 non-null    object 
 4   commentaire        150 non-null    object 
 5   conservee          83 non-null     object 
 6   dateAcquisition    234 non-null    int64  
 7   droitReel          234 non-null    object 
 8   id                 234 non-null    object 
 9   label              6 non-null      object 
 10  localite           234 non-null    object 
 11  nature             234 non-null    object 
 12  origine            234 non-null    object 
 13  prixAcquisition    234 non-null    int64  
 14  prixTravaux        141 non-null    float64
 15  quotePart          234 non-null    object 
 16  regimeJuridique    234 non

In [92]:
immeubleDto = modifications_pour_export(immeubleDto, index=['id_declaration', 'id_immeubleDto'])
immeubleDto.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,adresse,code_postal,commentaire,conservee,date_acquisition,droit_reel,id,label,localite,nature,origine,prix_acquisition,prix_travaux,quote_part,regime_juridique,superficie_bati,superficie_non_bati,valeur_venale
id_declaration,id_immeuble_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
251,58,[Données non publiées],[Données non publiées] (Département : 75),[Données non publiées],,1994,Pleine propriété,CREATION,,[Données non publiées],Appartement,Acquisition,304924,30000.0,100.0,Bien propre,91,0.0,1210000
251,59,[Données non publiées],[Données non publiées] (Département : 12),[Données non publiées],,2015,Usufruit,CREATION,,[Données non publiées],Maison,Acquisition,178000,20000.0,100.0,Bien indivis,225,0.0,70000
251,60,[Données non publiées],[Données non publiées] (Département : 75),[Données non publiées],,2022,Usufruit,CREATION,,[Données non publiées],Garage,Acquisition,30000,,100.0,Bien indivis,0,0.001,12000
267,147,[Données non publiées],[Données non publiées] (Département : 64),La valeur vénale déclarée correspond à ma part...,False,2000,Nue-propriété,CREATION,,[Données non publiées],Maison individuelle,Acquisition,600000,,16.0,Bien indivis,310,0.7,150000
433,18,[Données non publiées],[Données non publiées] (Département : 42),[Données non publiées],False,2014,Pleine propriété,CREATION,,[Données non publiées],Appartement,Succession,21250,,25.0,Bien indivis,126,0.0,34452


### assuranceVieDto

In [93]:
assuranceVieDto = pd.read_csv(folder + 'assuranceVieDto.csv')
assuranceVieDto.head()

Unnamed: 0,id_declaration,idassuranceVieDto,commentaire,conservee,dateSouscription,etablissement,id,label,reference,souscripteur,valeurRachat
0,251,60,[Données non publiées],,30/11/2020,AGEAS,CREATION,,[Données non publiées],Dujols Dominique,31202
1,251,61,[Données non publiées],,30/09/2015,CEIDF,CREATION,,[Données non publiées],Dominique DUJOLS,64825
2,433,18,Valeur de rachat au 30 juin 2022.,False,02/12/1999,Axa,CREATION,,[Données non publiées],Jean-Noël Barrot,3939
3,433,19,Valeur de rachat au 01/08/2022,,07/03/2018,Crédit Agricole,CREATION,,[Données non publiées],Jean-Noël Barrot,1570156
4,499,178,,False,24/06/2011,BNP [Données non publiées],CREATION,Entrée dans le patrimoine,[Données non publiées],Provost-Lopin Martine,188612


In [94]:
assuranceVieDto.rename(columns={'idassuranceVieDto' : 'id_assuranceVieDto'}, inplace=True)

In [95]:
assuranceVieDto = modification_date1(assuranceVieDto, 'dateSouscription')

In [96]:
assuranceVieDto.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 199 entries, 0 to 198
Data columns (total 11 columns):
 #   Column              Non-Null Count  Dtype         
---  ------              --------------  -----         
 0   id_declaration      199 non-null    int64         
 1   id_assuranceVieDto  199 non-null    int64         
 2   commentaire         71 non-null     object        
 3   conservee           43 non-null     object        
 4   dateSouscription    199 non-null    datetime64[ns]
 5   etablissement       199 non-null    object        
 6   id                  199 non-null    object        
 7   label               10 non-null     object        
 8   reference           199 non-null    object        
 9   souscripteur        199 non-null    object        
 10  valeurRachat        199 non-null    int64         
dtypes: datetime64[ns](1), int64(3), object(7)
memory usage: 17.2+ KB


In [97]:
assuranceVieDto = modifications_pour_export(assuranceVieDto, index=['id_declaration', 'id_assuranceVieDto'])
assuranceVieDto.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,commentaire,conservee,date_souscription,etablissement,id,label,reference,souscripteur,valeur_rachat
id_declaration,id_assurance_vie_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
251,60,[Données non publiées],,2020-11-30,AGEAS,CREATION,,[Données non publiées],Dujols Dominique,31202
251,61,[Données non publiées],,2015-09-30,CEIDF,CREATION,,[Données non publiées],Dominique DUJOLS,64825
433,18,Valeur de rachat au 30 juin 2022.,False,1999-12-02,Axa,CREATION,,[Données non publiées],Jean-Noël Barrot,3939
433,19,Valeur de rachat au 01/08/2022,,2018-03-07,Crédit Agricole,CREATION,,[Données non publiées],Jean-Noël Barrot,1570156
499,178,,False,2011-06-24,BNP [Données non publiées],CREATION,Entrée dans le patrimoine,[Données non publiées],Provost-Lopin Martine,188612


### passifDto

In [98]:
passifDto = pd.read_csv(folder + 'passifDto.csv')
passifDto.head()

Unnamed: 0,id_declaration,idpassifDto,adresseCreancier,commentaire,conservee,datePassif,duree,id,mensualite,montant,nature,nomCreancier,objetDette,restantDu
0,251,32,[Données non publiées],,,07/01/2022,24,CREATION,893,21000,Emprunt bancaire,CEIDF,acquisition garage,21000
1,433,10,[Données non publiées],[Données non publiées],,01/12/2018,300,CREATION,3135,825000,Emprunt immobilier,Crédit Agricole,Acquisition immobilière,359365
2,617,120,[Données non publiées],[Données non publiées],,10/09/2019,300,CREATION,2202,577500,emprunt bancaire,caisse d'epargne,acquisition immobilière,564910
3,664,109,[Données non publiées],,,15/10/2018,240,CREATION,638,117140,Crédit Immobilier,Crédit Mutuel,acquisition immobilière,103938
4,899,9,[Données non publiées],[Données non publiées],,01/12/2018,300,CREATION,3135,825000,Emprunt immobilier,Crédit Agricole,Acquisition immobilière,359365


In [99]:
passifDto.rename(columns={'idpassifDto' : 'id_passifDto'}, inplace=True)

In [100]:
passifDto = modification_date1(passifDto, 'datePassif')

In [101]:
passifDto.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 121 entries, 0 to 120
Data columns (total 14 columns):
 #   Column            Non-Null Count  Dtype         
---  ------            --------------  -----         
 0   id_declaration    121 non-null    int64         
 1   id_passifDto      121 non-null    int64         
 2   adresseCreancier  121 non-null    object        
 3   commentaire       53 non-null     object        
 4   conservee         33 non-null     object        
 5   datePassif        121 non-null    datetime64[ns]
 6   duree             121 non-null    int64         
 7   id                121 non-null    object        
 8   mensualite        121 non-null    int64         
 9   montant           121 non-null    int64         
 10  nature            121 non-null    object        
 11  nomCreancier      121 non-null    object        
 12  objetDette        121 non-null    object        
 13  restantDu         121 non-null    int64         
dtypes: datetime64[ns](1), int6

In [102]:
passifDto = modifications_pour_export(passifDto, index=['id_declaration', 'id_passifDto'])
passifDto.head()

Unnamed: 0_level_0,Unnamed: 1_level_0,adresse_creancier,commentaire,conservee,date_passif,duree,id,mensualite,montant,nature,nom_creancier,objet_dette,restant_du
id_declaration,id_passif_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1
251,32,[Données non publiées],,,2022-01-07,24,CREATION,893,21000,Emprunt bancaire,CEIDF,acquisition garage,21000
433,10,[Données non publiées],[Données non publiées],,2018-12-01,300,CREATION,3135,825000,Emprunt immobilier,Crédit Agricole,Acquisition immobilière,359365
617,120,[Données non publiées],[Données non publiées],,2019-09-10,300,CREATION,2202,577500,emprunt bancaire,caisse d'epargne,acquisition immobilière,564910
664,109,[Données non publiées],,,2018-10-15,240,CREATION,638,117140,Crédit Immobilier,Crédit Mutuel,acquisition immobilière,103938
899,9,[Données non publiées],[Données non publiées],,2018-12-01,300,CREATION,3135,825000,Emprunt immobilier,Crédit Agricole,Acquisition immobilière,359365


### valeursEnBourseDto

In [103]:
valeursEnBourseDto = pd.read_csv(folder + 'valeursEnBourseDto.csv')
valeursEnBourseDto.head()

Unnamed: 0,id_declaration,idvaleursEnBourseDto,commentaire,conservee,etablissement,id,label,naturePlacement,numeroCompte,titulaire,valeur
0,251,29,,,CEIDF,CREATION,,PEA,[Données non publiées],Dujols Dominique,40
1,433,7,Souscription le 6/11/2021 de 100 parts du fond...,,,CREATION,,FCPR,[Données non publiées],Jean-Noël BARROT,12032
2,499,83,"la somme de 30874,47 euros correspond à un PEA...",False,BNP [Données non publiées],CREATION,Entrée dans le patrimoine,PEA,[Données non publiées],[Données non publiées],30874
3,499,84,,,BNP [Données non publiées],CREATION,,Compte titre,[Données non publiées],[Données non publiées],140
4,594,77,PEE liquidé pour couvrir la donation et les fr...,,BNP PE & RE,CREATION,,Compte titre,[Données non publiées],[Données non publiées],0


In [104]:
valeursEnBourseDto.rename(columns={'idvaleursEnBourseDto' : 'id_valeursEnBourseDto'}, inplace=True)

In [105]:
valeursEnBourseDto.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 103 entries, 0 to 102
Data columns (total 11 columns):
 #   Column                 Non-Null Count  Dtype 
---  ------                 --------------  ----- 
 0   id_declaration         103 non-null    int64 
 1   id_valeursEnBourseDto  103 non-null    int64 
 2   commentaire            62 non-null     object
 3   conservee              39 non-null     object
 4   etablissement          99 non-null     object
 5   id                     103 non-null    object
 6   label                  5 non-null      object
 7   naturePlacement        103 non-null    object
 8   numeroCompte           103 non-null    object
 9   titulaire              103 non-null    object
 10  valeur                 103 non-null    int64 
dtypes: int64(3), object(8)
memory usage: 9.0+ KB


In [106]:
valeursEnBourseDto = modifications_pour_export(valeursEnBourseDto, index=['id_declaration', 'id_valeursEnBourseDto'])
valeursEnBourseDto.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,commentaire,conservee,etablissement,id,label,nature_placement,numero_compte,titulaire,valeur
id_declaration,id_valeurs_en_bourse_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
251,29,,,CEIDF,CREATION,,PEA,[Données non publiées],Dujols Dominique,40
433,7,Souscription le 6/11/2021 de 100 parts du fond...,,,CREATION,,FCPR,[Données non publiées],Jean-Noël BARROT,12032
499,83,"la somme de 30874,47 euros correspond à un PEA...",False,BNP [Données non publiées],CREATION,Entrée dans le patrimoine,PEA,[Données non publiées],[Données non publiées],30874
499,84,,,BNP [Données non publiées],CREATION,,Compte titre,[Données non publiées],[Données non publiées],140
594,77,PEE liquidé pour couvrir la donation et les fr...,,BNP PE & RE,CREATION,,Compte titre,[Données non publiées],[Données non publiées],0


### sciDto_immeubles

In [107]:
sciDto_immeubles = pd.read_csv(folder + 'sciDto_immeubles.csv')
sciDto_immeubles.head()

Unnamed: 0,id_declaration,id_sciDto,id_immeuble,adresse,codePostal,commentaire,conservee,dateAcquisition,droitReel,id,localite,nature,origine,prixAcquisition,prixTravaux,quotePart,superficieBati,superficieNonBati,valeurVenale
0,251,11,12,[Données non publiées],[Données non publiées] (Département : 75),[Données non publiées],,2011,Pleine propriété,CREATION,[Données non publiées],Appartement,Acquisition,325000,10000.0,100.0,32,0.0,410000
1,433,4,3,[Données non publiées],[Données non publiées] (Département : 43),[Données non publiées],False,2011,Pleine propriété,CREATION,[Données non publiées],Maison individuelle,Acquisition,0,,100.0,750,0.9,550000
2,664,30,41,[Données non publiées],[Données non publiées] (Département : 34),,,2013,Pleine propriété,CREATION,[Données non publiées],Appartement,Acquisition,115000,15000.0,29.0,75,0.0,120000
3,664,30,42,[Données non publiées],[Données non publiées] (Département : 34),,,2015,Pleine propriété,CREATION,[Données non publiées],Maison individuelle,Acquisition,570000,100000.0,29.0,300,0.14,1000000
4,664,30,43,[Données non publiées],[Données non publiées] (Département : 34),,,2020,Pleine propriété,CREATION,[Données non publiées],Appartement,Acquisition,125000,5000.0,29.0,66,0.0,130000


In [108]:
sciDto_immeubles.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 63 entries, 0 to 62
Data columns (total 19 columns):
 #   Column             Non-Null Count  Dtype  
---  ------             --------------  -----  
 0   id_declaration     63 non-null     int64  
 1   id_sciDto          63 non-null     int64  
 2   id_immeuble        63 non-null     int64  
 3   adresse            63 non-null     object 
 4   codePostal         63 non-null     object 
 5   commentaire        20 non-null     object 
 6   conservee          24 non-null     object 
 7   dateAcquisition    63 non-null     int64  
 8   droitReel          63 non-null     object 
 9   id                 63 non-null     object 
 10  localite           63 non-null     object 
 11  nature             63 non-null     object 
 12  origine            63 non-null     object 
 13  prixAcquisition    63 non-null     int64  
 14  prixTravaux        37 non-null     float64
 15  quotePart          63 non-null     float64
 16  superficieBati     63 non-nu

In [109]:
sciDto_immeubles = modifications_pour_export(sciDto_immeubles, index=['id_declaration', 'id_sciDto', 'id_immeuble'])
sciDto_immeubles.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,adresse,code_postal,commentaire,conservee,date_acquisition,droit_reel,id,localite,nature,origine,prix_acquisition,prix_travaux,quote_part,superficie_bati,superficie_non_bati,valeur_venale
id_declaration,id_sci_dto,id_immeuble,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1
251,11,12,[Données non publiées],[Données non publiées] (Département : 75),[Données non publiées],,2011,Pleine propriété,CREATION,[Données non publiées],Appartement,Acquisition,325000,10000.0,100.0,32,0.0,410000
433,4,3,[Données non publiées],[Données non publiées] (Département : 43),[Données non publiées],False,2011,Pleine propriété,CREATION,[Données non publiées],Maison individuelle,Acquisition,0,,100.0,750,0.9,550000
664,30,41,[Données non publiées],[Données non publiées] (Département : 34),,,2013,Pleine propriété,CREATION,[Données non publiées],Appartement,Acquisition,115000,15000.0,29.0,75,0.0,120000
664,30,42,[Données non publiées],[Données non publiées] (Département : 34),,,2015,Pleine propriété,CREATION,[Données non publiées],Maison individuelle,Acquisition,570000,100000.0,29.0,300,0.14,1000000
664,30,43,[Données non publiées],[Données non publiées] (Département : 34),,,2020,Pleine propriété,CREATION,[Données non publiées],Appartement,Acquisition,125000,5000.0,29.0,66,0.0,130000


### sciDto

In [110]:
sciDto = pd.read_csv(folder + 'sciDto.csv')
sciDto.head(20)

Unnamed: 0,id_declaration,idsciDto,autreActif,capitalDetenu,commentaire,conservee,denomination,droitReel,id,passif,valeur
0,251,11,néant,5.8,,,[Données non publiées],Usufruit,CREATION,néant,9600
1,267,27,,16.0,La SCI [Données non publiées] gère ...,False,[Données non publiées],Nue-propriété,CREATION,,150000
2,433,4,Disponibilités : 1164 euros (au 31/12/2020),32.5,30 % en pleine propriété. 10 % en indivision ...,False,[Données non publiées],Pleine propriété,CREATION,Compte courant d'associés; valeur recouvrable ...,1
3,664,30,compte bancaires crédit Mutuel crédit Agricole,29.0,SCI [Données non publiées] Patricia...,False,[Données non publiées],Pleine propriété,CREATION,Emprunt Crédit Agricole 156472€ 83071€ Emprunt...,254717
4,664,31,,25.0,,,[Données non publiées],Pleine propriété,CREATION,Emprunt Crédit Agricole 352391€,250
5,899,3,Disponibilités : 1164 euros (au 31/12/2020),32.5,30 % en pleine propriété. 10 % en indivision ...,False,[Données non publiées],Pleine propriété,CREATION,Compte courant d'associés; valeur recouvrable ...,1
6,1226,13,,2.0,SCI familiale [Données non publiées] ...,False,[Données non publiées],Pleine propriété,CREATION,[Données non publiées] : Initialement de 3...,4000
7,2245,28,compte Crédit agricole :solde nul à ma connais...,33.0,SCI familiale détenant la nue propriété qui va...,,[Données non publiées],Pleine propriété,CREATION,néant,64500
8,2556,17,0,50.0,"aucun bien, aucune activité",,[Données non publiées],Pleine propriété,CREATION,0,-5
9,3726,32,compte bancaires crédit Mutuel crédit Agricole,29.0,SCI [Données non publiées] Patrici...,False,[Données non publiées],Pleine propriété,CREATION,Emprunt Crédit Agricole 156472€ 83071€ Emprunt...,254717


In [111]:
sciDto.rename(columns={'idsciDto' : 'id_sciDto'}, inplace=True)

In [112]:
sciDto.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 58 entries, 0 to 57
Data columns (total 11 columns):
 #   Column          Non-Null Count  Dtype  
---  ------          --------------  -----  
 0   id_declaration  58 non-null     int64  
 1   id_sciDto       58 non-null     int64  
 2   autreActif      41 non-null     object 
 3   capitalDetenu   58 non-null     float64
 4   commentaire     35 non-null     object 
 5   conservee       30 non-null     object 
 6   denomination    58 non-null     object 
 7   droitReel       58 non-null     object 
 8   id              58 non-null     object 
 9   passif          50 non-null     object 
 10  valeur          58 non-null     int64  
dtypes: float64(1), int64(3), object(7)
memory usage: 5.1+ KB


In [113]:
sciDto = modifications_pour_export(sciDto, index=['id_declaration', 'id_sciDto'])
sciDto.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,autre_actif,capital_detenu,commentaire,conservee,denomination,droit_reel,id,passif,valeur
id_declaration,id_sci_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
251,11,néant,5.8,,,[Données non publiées],Usufruit,CREATION,néant,9600
267,27,,16.0,La SCI [Données non publiées] gère ...,False,[Données non publiées],Nue-propriété,CREATION,,150000
433,4,Disponibilités : 1164 euros (au 31/12/2020),32.5,30 % en pleine propriété. 10 % en indivision ...,False,[Données non publiées],Pleine propriété,CREATION,Compte courant d'associés; valeur recouvrable ...,1
664,30,compte bancaires crédit Mutuel crédit Agricole,29.0,SCI [Données non publiées] Patricia...,False,[Données non publiées],Pleine propriété,CREATION,Emprunt Crédit Agricole 156472€ 83071€ Emprunt...,254717
664,31,,25.0,,,[Données non publiées],Pleine propriété,CREATION,Emprunt Crédit Agricole 352391€,250


### vehiculeDto

In [114]:
vehiculeDto = pd.read_csv(folder + 'vehiculeDto.csv')
vehiculeDto.head()

Unnamed: 0,id_declaration,idvehiculeDto,anneeAchat,commentaire,conservee,id,label,marque,nature,valeur,valeurAchat
0,251,26,2003,,,CREATION,,Peugeot Partner,Terrestre à moteur,2900,13000
1,499,77,2016,,False,CREATION,Entrée dans le patrimoine,renault clio,terrestre à moteur,8500,15000
2,594,73,2016,[Données non publiées],,CREATION,,RENAULT espace IV,Terrestre à moteur,15000,19350
3,594,74,2016,Bateau semi-rigide acheté d'occasion,,CREATION,,Caribe Nautica,Bateau,15000,18500
4,664,60,2015,,,CREATION,,lancia,Terrestre à moteur,300,2000


In [115]:
vehiculeDto.rename(columns={'idvehiculeDto' : 'id_vehiculeDto'}, inplace=True)

In [116]:
vehiculeDto.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 97 entries, 0 to 96
Data columns (total 11 columns):
 #   Column          Non-Null Count  Dtype 
---  ------          --------------  ----- 
 0   id_declaration  97 non-null     int64 
 1   id_vehiculeDto  97 non-null     int64 
 2   anneeAchat      97 non-null     int64 
 3   commentaire     46 non-null     object
 4   conservee       28 non-null     object
 5   id              97 non-null     object
 6   label           6 non-null      object
 7   marque          97 non-null     object
 8   nature          97 non-null     object
 9   valeur          97 non-null     int64 
 10  valeurAchat     97 non-null     int64 
dtypes: int64(5), object(6)
memory usage: 8.5+ KB


In [117]:
vehiculeDto = modifications_pour_export(vehiculeDto, index=['id_declaration', 'id_vehiculeDto'])
vehiculeDto.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,annee_achat,commentaire,conservee,id,label,marque,nature,valeur,valeur_achat
id_declaration,id_vehicule_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
251,26,2003,,,CREATION,,Peugeot Partner,Terrestre à moteur,2900,13000
499,77,2016,,False,CREATION,Entrée dans le patrimoine,renault clio,terrestre à moteur,8500,15000
594,73,2016,[Données non publiées],,CREATION,,RENAULT espace IV,Terrestre à moteur,15000,19350
594,74,2016,Bateau semi-rigide acheté d'occasion,,CREATION,,Caribe Nautica,Bateau,15000,18500
664,60,2015,,,CREATION,,lancia,Terrestre à moteur,300,2000


### valeursNonEnBourseDto

In [118]:
valeursNonEnBourseDto = pd.read_csv(folder + 'valeursNonEnBourseDto.csv')
valeursNonEnBourseDto.head()

Unnamed: 0,id_declaration,idvaleursNonEnBourseDto,commentaire,conservee,denomination,droitReel,id,participation,valeurActuelle
0,433,1,[Données non publiées],False,Explain (ex Liegey Muller Pons),Pleine propriété,CREATION,0.19,27816
1,594,38,Montant des capitaux propres au 30 septembre 2...,,SARL Domaine de La Grange,Pleine propriété,CREATION,6.666,64252
2,594,39,"Valeur estimée du GFA: Terres agricoles: 31,7 ...",,GFA [Données non publiées],Pleine propriété,CREATION,6.6666,80624
3,617,46,,,AML SARL,Pleine propriété,CREATION,20.0,2473
4,899,0,[Données non publiées],False,Explain (ex Liegey Muller Pons),Pleine propriété,CREATION,0.19,27816


In [119]:
valeursNonEnBourseDto.rename(columns={'idvaleursNonEnBourseDto' : 'id_valeursNonEnBourseDto'}, inplace=True)

In [120]:
valeursNonEnBourseDto.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 47 entries, 0 to 46
Data columns (total 9 columns):
 #   Column                    Non-Null Count  Dtype  
---  ------                    --------------  -----  
 0   id_declaration            47 non-null     int64  
 1   id_valeursNonEnBourseDto  47 non-null     int64  
 2   commentaire               33 non-null     object 
 3   conservee                 19 non-null     object 
 4   denomination              47 non-null     object 
 5   droitReel                 47 non-null     object 
 6   id                        47 non-null     object 
 7   participation             43 non-null     float64
 8   valeurActuelle            47 non-null     int64  
dtypes: float64(1), int64(3), object(5)
memory usage: 3.4+ KB


In [121]:
valeursNonEnBourseDto = modifications_pour_export(valeursNonEnBourseDto, index=['id_declaration', 'id_valeursNonEnBourseDto'])
valeursNonEnBourseDto.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,commentaire,conservee,denomination,droit_reel,id,participation,valeur_actuelle
id_declaration,id_valeurs_non_en_bourse_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
433,1,[Données non publiées],False,Explain (ex Liegey Muller Pons),Pleine propriété,CREATION,0.19,27816
594,38,Montant des capitaux propres au 30 septembre 2...,,SARL Domaine de La Grange,Pleine propriété,CREATION,6.666,64252
594,39,"Valeur estimée du GFA: Terres agricoles: 31,7 ...",,GFA [Données non publiées],Pleine propriété,CREATION,6.6666,80624
617,46,,,AML SARL,Pleine propriété,CREATION,20.0,2473
899,0,[Données non publiées],False,Explain (ex Liegey Muller Pons),Pleine propriété,CREATION,0.19,27816


### autreBienDto

In [122]:
autreBienDto = pd.read_csv(folder + 'autreBienDto.csv')
autreBienDto.head()

Unnamed: 0,id_declaration,idautreBienDto,commentaire,conservee,denomination,description,id,valeur
0,433,4,Compte courant d'associés d'une valeur au 31/1...,False,SCI [Données non publiées],Compte courant d'associés,CREATION,126567
1,433,5,39.501 : Compte courant d'associé en pleine pr...,,SCI [Données non publiées],Compte courant d'associé,CREATION,45181
2,433,6,Indivision [Données non publiées] Qu...,,Caisse des Règlements Pécuniaires des Avocats ...,Liquidités,CREATION,313573
3,499,45,,,,créances de restitution de deux contrats d'ass...,CREATION,118186
4,594,42,[Données non publiées],,,Prêt [Données non publiées],CREATION,300000


In [123]:
autreBienDto.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 55 entries, 0 to 54
Data columns (total 8 columns):
 #   Column          Non-Null Count  Dtype 
---  ------          --------------  ----- 
 0   id_declaration  55 non-null     int64 
 1   idautreBienDto  55 non-null     int64 
 2   commentaire     28 non-null     object
 3   conservee       10 non-null     object
 4   denomination    39 non-null     object
 5   description     55 non-null     object
 6   id              55 non-null     object
 7   valeur          55 non-null     int64 
dtypes: int64(3), object(5)
memory usage: 3.6+ KB


In [124]:
autreBienDto.rename(columns={'idautreBienDto' : 'id_autreBienDto'}, inplace=True)

In [125]:
autreBienDto = modifications_pour_export(autreBienDto, index=['id_declaration', 'id_autreBienDto'])
autreBienDto.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,commentaire,conservee,denomination,description,id,valeur
id_declaration,id_autre_bien_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
433,4,Compte courant d'associés d'une valeur au 31/1...,False,SCI [Données non publiées],Compte courant d'associés,CREATION,126567
433,5,39.501 : Compte courant d'associé en pleine pr...,,SCI [Données non publiées],Compte courant d'associé,CREATION,45181
433,6,Indivision [Données non publiées] Qu...,,Caisse des Règlements Pécuniaires des Avocats ...,Liquidités,CREATION,313573
499,45,,,,créances de restitution de deux contrats d'ass...,CREATION,118186
594,42,[Données non publiées],,,Prêt [Données non publiées],CREATION,300000


### bienEtrangerDto

In [126]:
bienEtrangerDto = pd.read_csv(folder + 'bienEtrangerDto.csv')
bienEtrangerDto.head()

Unnamed: 0,id_declaration,idbienEtrangerDto,commentaire,conservee,description,id,localisation,nature,valeur
0,433,2,[Données non publiées],False,"401(K), plan d'épargne retraite herbergé par l...",CREATION,[Données non publiées],Compte d'épargne,89561
1,433,3,[Données non publiées],,,CREATION,[Données non publiées],Compte courant,1681
2,617,35,,,compte à vue,CREATION,[Données non publiées],Compte courant,219
3,617,36,,,Garantie locative,CREATION,[Données non publiées],Livret vert ING,1954
4,899,0,[Données non publiées],False,"401(K), plan d'épargne retraite herbergé par l...",CREATION,[Données non publiées],Compte d'épargne,89561


In [127]:
bienEtrangerDto.rename(columns={'idbienEtrangerDto' : 'id_bienEtrangerDto'}, inplace=True)

In [128]:
bienEtrangerDto.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 37 entries, 0 to 36
Data columns (total 9 columns):
 #   Column              Non-Null Count  Dtype 
---  ------              --------------  ----- 
 0   id_declaration      37 non-null     int64 
 1   id_bienEtrangerDto  37 non-null     int64 
 2   commentaire         24 non-null     object
 3   conservee           25 non-null     object
 4   description         35 non-null     object
 5   id                  37 non-null     object
 6   localisation        37 non-null     object
 7   nature              37 non-null     object
 8   valeur              37 non-null     int64 
dtypes: int64(3), object(6)
memory usage: 2.7+ KB


In [129]:
bienEtrangerDto = modifications_pour_export(bienEtrangerDto, index=['id_declaration', 'id_bienEtrangerDto'])
bienEtrangerDto.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,commentaire,conservee,description,id,localisation,nature,valeur
id_declaration,id_bien_etranger_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
433,2,[Données non publiées],False,"401(K), plan d'épargne retraite herbergé par l...",CREATION,[Données non publiées],Compte d'épargne,89561
433,3,[Données non publiées],,,CREATION,[Données non publiées],Compte courant,1681
617,35,,,compte à vue,CREATION,[Données non publiées],Compte courant,219
617,36,,,Garantie locative,CREATION,[Données non publiées],Livret vert ING,1954
899,0,[Données non publiées],False,"401(K), plan d'épargne retraite herbergé par l...",CREATION,[Données non publiées],Compte d'épargne,89561


### observationPatrimoineDto

In [130]:
observationPatrimoineDto = pd.read_csv(folder + 'observationPatrimoineDto.csv')
observationPatrimoineDto.head()

Unnamed: 0,id_declaration,idobservationPatrimoineDto,contenu,id
0,251,12,[Données non publiées],CREATION
1,433,2,[Données non publiées],CREATION
2,594,27,[Données non publiées],CREATION
3,899,1,[Données non publiées],CREATION
4,921,18,[Données non publiées],CREATION


In [131]:
observationPatrimoineDto.rename(columns={'idobservationPatrimoineDto' : 'id_observationPatrimoineDto'}, inplace=True)

In [132]:
observationPatrimoineDto.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 31 entries, 0 to 30
Data columns (total 4 columns):
 #   Column                       Non-Null Count  Dtype 
---  ------                       --------------  ----- 
 0   id_declaration               31 non-null     int64 
 1   id_observationPatrimoineDto  31 non-null     int64 
 2   contenu                      31 non-null     object
 3   id                           31 non-null     object
dtypes: int64(2), object(2)
memory usage: 1.1+ KB


### bienDiverDto

In [133]:
bienDiverDto = pd.read_csv(folder + 'bienDiverDto.csv')
bienDiverDto.head()

Unnamed: 0,id_declaration,idbienDiverDto,commentaire,conservee,description,id,typeEstimation,valeur
0,267,8,,False,Lithographies et tableaux,CREATION,Évaluation personnelle,15000
1,267,9,[Données non publiées],False,Mobilier - Commode,CREATION,Évaluation personnelle,10000
2,4011,7,Achat mobilier qui ne sera effectif que le 20....,,Un APPARTEMENT au cinquième étage gauche ...,CREATION,Valeur d’acquisition,2390000
3,4618,11,[Données non publiées],,Tableau [Données non publiées],CREATION,demande à expert octobre 2018,30000
4,6787,1,,,Montre : ROLEX Daytona,CREATION,Expertise,13000


In [134]:
bienDiverDto.rename(columns={'idbienDiverDto' : 'id_bienDiverDto'}, inplace=True)

In [135]:
bienDiverDto.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 13 entries, 0 to 12
Data columns (total 8 columns):
 #   Column           Non-Null Count  Dtype 
---  ------           --------------  ----- 
 0   id_declaration   13 non-null     int64 
 1   id_bienDiverDto  13 non-null     int64 
 2   commentaire      5 non-null      object
 3   conservee        6 non-null      object
 4   description      13 non-null     object
 5   id               13 non-null     object
 6   typeEstimation   13 non-null     object
 7   valeur           13 non-null     int64 
dtypes: int64(3), object(5)
memory usage: 960.0+ bytes


In [136]:
bienDiverDto = modifications_pour_export(bienDiverDto, index=['id_declaration', 'id_bienDiverDto'])
bienDiverDto.head()

la colonne 'montant' n'existe pas dans la table.


Unnamed: 0_level_0,Unnamed: 1_level_0,commentaire,conservee,description,id,type_estimation,valeur
id_declaration,id_bien_diver_dto,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
267,8,,False,Lithographies et tableaux,CREATION,Évaluation personnelle,15000
267,9,[Données non publiées],False,Mobilier - Commode,CREATION,Évaluation personnelle,10000
4011,7,Achat mobilier qui ne sera effectif que le 20....,,Un APPARTEMENT au cinquième étage gauche ...,CREATION,Valeur d’acquisition,2390000
4618,11,[Données non publiées],,Tableau [Données non publiées],CREATION,demande à expert octobre 2018,30000
6787,1,,,Montre : ROLEX Daytona,CREATION,Expertise,13000


### fondDto

In [137]:
fondDto = pd.read_csv(folder + 'fondDto.csv')
fondDto

Unnamed: 0,id_declaration,idfondDto,actif,commentaire,conservee,description,endettement,id,label,nature,resultatFiscal,valeur
0,499,2,,deux comptes bancaires professionnels : --- BN...,False,kinésithérapie : activité libérale exercée par...,,CREATION,Entrée dans le patrimoine,Clientèle,67214,
1,1604,0,,deux comptes bancaires professionnels : --- BN...,False,kinésithérapie : activité libérale exercée par...,,CREATION,Entrée dans le patrimoine,Clientèle,67214,
2,3424,4,5000.0,Activité mise en sommeil depuis ma nomination ...,,Activité de conseil,0.0,CREATION,,Clientèle,5306,0.0
3,4825,1,,deux comptes bancaires professionnels : --- BN...,False,kinésithérapie : activité libérale exercée par...,,CREATION,Entrée dans le patrimoine,Clientèle,67214,
4,5809,3,,,False,kinésithérapie : activité libérale exercée par...,,CREATION,Entrée dans le patrimoine,Clientèle,79590,
5,6552,5,5000.0,Activité mise en sommeil depuis ma nomination ...,,Activité de conseil,0.0,CREATION,,Clientèle,5306,0.0


In [138]:
fondDto.rename(columns={'idfondDto' : 'id_fondDto'}, inplace=True)

In [139]:
A = ressources.reset_index()

## Creation de la base de données sur PostgreSQL

In [140]:
# liste des plus gros fichiers
for fichier in fichiers_tailles['fichiers'].values[12:]:
    print(f"{fichier.replace('.csv','')}.to_sql('{(mise_en_forme_colonnes(fichier)).replace('.csv','')}', engine, if_exists='replace', index=True)")

attached_files.to_sql('attached_files', engine, if_exists='replace', index=True)
observationInteretDto.to_sql('observation_interet_dto', engine, if_exists='replace', index=True)
activConsultantDto.to_sql('activ_consultant_dto', engine, if_exists='replace', index=True)
comptesBancaireDto.to_sql('comptes_bancaire_dto', engine, if_exists='replace', index=True)
immeubleDto.to_sql('immeuble_dto', engine, if_exists='replace', index=True)
assuranceVieDto.to_sql('assurance_vie_dto', engine, if_exists='replace', index=True)
passifDto.to_sql('passif_dto', engine, if_exists='replace', index=True)
valeursEnBourseDto.to_sql('valeurs_en_bourse_dto', engine, if_exists='replace', index=True)
sciDto_immeubles.to_sql('sci_dto_immeubles', engine, if_exists='replace', index=True)
sciDto.to_sql('sci_dto', engine, if_exists='replace', index=True)
vehiculeDto.to_sql('vehicule_dto', engine, if_exists='replace', index=True)
valeursNonEnBourseDto.to_sql('valeurs_non_en_bourse_dto', engine, if_exists='replace', 

In [141]:
# création de la connexion 
conn = psycopg2.connect(
    host="localhost",
    database="declarations_modif",
    user="postgres",
    password="radrio06"
)

# création de l'engine qui sert à la connection
engine = create_engine('postgresql://postgres:radrio06@localhost:5432/declarations_modif')

In [142]:
erreurs = []


# objet pour inspecter la table dans la base de données
#inspector = inspect(engine)
# nom des tables
#nom_table = inspector.get_table_names()

# export des tables
try :
    
    individus.to_sql('individus', engine, if_exists='replace', index=True)
    ressources.to_sql('ressources', engine, if_exists='replace', index=True)
    declarations.to_sql('declarations', engine, if_exists='replace', index=True)
    participationDirigeantDto.to_sql('participation_dirigeant_dto', engine, if_exists='replace', index=True)
    mandatElectifDto.to_sql('mandat_electif_dto', engine, if_exists='replace', index=True)
    participationFinanciereDto.to_sql('participation_financiere_dto', engine, if_exists='replace', index=True)
    activProfCinqDerniereDto.to_sql('activ_prof_cinq_derniere_dto', engine, if_exists='replace', index=True)
    activProfConjointDto.to_sql('activ_prof_conjoint_dto', engine, if_exists='replace', index=True)
    fonctionBenevoleDto.to_sql('fonction_benevole_dto', engine, if_exists='replace', index=True)
    activCollaborateursDto.to_sql('activ_collaborateurs_dto', engine, if_exists='replace', index=True)


# gestion des exceptions
except Exception as error:
    print(error)

In [143]:
erreurs = []


# objet pour inspecter la table dans la base de données
#inspector = inspect(engine)
# nom des tables
#nom_table = inspector.get_table_names()

# export des tables
try :
    
    attached_files.to_sql('attached_files', engine, if_exists='replace', index=True)
    observationInteretDto.to_sql('observation_interet_dto', engine, if_exists='replace', index=True)
    activConsultantDto.to_sql('activ_consultant_dto', engine, if_exists='replace', index=True)
    comptesBancaireDto.to_sql('comptes_bancaire_dto', engine, if_exists='replace', index=True)
    immeubleDto.to_sql('immeuble_dto', engine, if_exists='replace', index=True)
    assuranceVieDto.to_sql('assurance_vie_dto', engine, if_exists='replace', index=True)
    passifDto.to_sql('passif_dto', engine, if_exists='replace', index=True)
    valeursEnBourseDto.to_sql('valeurs_en_bourse_dto', engine, if_exists='replace', index=True)
    sciDto_immeubles.to_sql('sci_dto_immeubles', engine, if_exists='replace', index=True)
    sciDto.to_sql('sci_dto', engine, if_exists='replace', index=True)
    vehiculeDto.to_sql('vehicule_dto', engine, if_exists='replace', index=True)
    valeursNonEnBourseDto.to_sql('valeurs_non_en_bourse_dto', engine, if_exists='replace', index=True)
    autreBienDto.to_sql('autre_bien_dto', engine, if_exists='replace', index=True)
    bienEtrangerDto.to_sql('bien_etranger_dto', engine, if_exists='replace', index=True)
    bienDiverDto.to_sql('bien_diver_dto', engine, if_exists='replace', index=True)



# gestion des exceptions
except Exception as error:
    print(error)

In [144]:
# valide le commit, les modifications effectuées dans la base
conn.commit()

# ferme la connexion en fin de programme
conn.close()

### Script clés étrangères

In [131]:
# requete cles primaires et etrangères

for fichier in fichiers_tailles['fichiers'].values[2:]:
    nom_table = (mise_en_forme_colonnes(fichier)).replace('.csv','')
    print(f"alter table {nom_table} add constraint fk_{nom_table} foreign key (id_declaration) references declarations(id_declaration);")

alter table ressources add constraint fk_ressources foreign key (id_declaration) references declarations(id_declaration);
alter table participation_dirigeant_dto add constraint fk_participation_dirigeant_dto foreign key (id_declaration) references declarations(id_declaration);
alter table declarations add constraint fk_declarations foreign key (id_declaration) references declarations(id_declaration);
alter table mandat_electif_dto add constraint fk_mandat_electif_dto foreign key (id_declaration) references declarations(id_declaration);
alter table activ_prof_cinq_derniere_dto add constraint fk_activ_prof_cinq_derniere_dto foreign key (id_declaration) references declarations(id_declaration);
alter table individus add constraint fk_individus foreign key (id_declaration) references declarations(id_declaration);
alter table participation_financiere_dto add constraint fk_participation_financiere_dto foreign key (id_declaration) references declarations(id_declaration);
alter table activ_prof

### Script export fichiers

In [145]:
# export fichiers

for fichier in fichiers_tailles['fichiers'].values[2:]:
    nom_table = (mise_en_forme_colonnes(fichier))
    print(f"{fichier.replace('.csv', '')}.reset_index().to_csv(folder_export + '{fichier}', index=False)")

ressources.reset_index().to_csv(folder_export + 'ressources.csv', index=False)
participationDirigeantDto.reset_index().to_csv(folder_export + 'participationDirigeantDto.csv', index=False)
declarations.reset_index().to_csv(folder_export + 'declarations.csv', index=False)
mandatElectifDto.reset_index().to_csv(folder_export + 'mandatElectifDto.csv', index=False)
activProfCinqDerniereDto.reset_index().to_csv(folder_export + 'activProfCinqDerniereDto.csv', index=False)
individus.reset_index().to_csv(folder_export + 'individus.csv', index=False)
participationFinanciereDto.reset_index().to_csv(folder_export + 'participationFinanciereDto.csv', index=False)
activProfConjointDto.reset_index().to_csv(folder_export + 'activProfConjointDto.csv', index=False)
fonctionBenevoleDto.reset_index().to_csv(folder_export + 'fonctionBenevoleDto.csv', index=False)
activCollaborateursDto.reset_index().to_csv(folder_export + 'activCollaborateursDto.csv', index=False)
attached_files.reset_index().to_csv(folder_e

In [147]:
ressources.reset_index().to_csv(folder_export + 'ressources.csv', index=False)
participationDirigeantDto.reset_index().to_csv(folder_export + 'participationDirigeantDto.csv', index=False)
declarations.reset_index().to_csv(folder_export + 'declarations.csv', index=False)
mandatElectifDto.reset_index().to_csv(folder_export + 'mandatElectifDto.csv', index=False)
activProfCinqDerniereDto.reset_index().to_csv(folder_export + 'activProfCinqDerniereDto.csv', index=False)
individus.reset_index().to_csv(folder_export + 'individus.csv', index=False)
participationFinanciereDto.reset_index().to_csv(folder_export + 'participationFinanciereDto.csv', index=False)
activProfConjointDto.reset_index().to_csv(folder_export + 'activProfConjointDto.csv', index=False)
fonctionBenevoleDto.reset_index().to_csv(folder_export + 'fonctionBenevoleDto.csv', index=False)
activCollaborateursDto.reset_index().to_csv(folder_export + 'activCollaborateursDto.csv', index=False)
attached_files.reset_index().to_csv(folder_export + 'attached_files.csv', index=False)
observationInteretDto.reset_index().to_csv(folder_export + 'observationInteretDto.csv', index=False)
activConsultantDto.reset_index().to_csv(folder_export + 'activConsultantDto.csv', index=False)
comptesBancaireDto.reset_index().to_csv(folder_export + 'comptesBancaireDto.csv', index=False)
immeubleDto.reset_index().to_csv(folder_export + 'immeubleDto.csv', index=False)
assuranceVieDto.reset_index().to_csv(folder_export + 'assuranceVieDto.csv', index=False)
passifDto.reset_index().to_csv(folder_export + 'passifDto.csv', index=False)
valeursEnBourseDto.reset_index().to_csv(folder_export + 'valeursEnBourseDto.csv', index=False)
sciDto_immeubles.reset_index().to_csv(folder_export + 'sciDto_immeubles.csv', index=False)
sciDto.reset_index().to_csv(folder_export + 'sciDto.csv', index=False)
vehiculeDto.reset_index().to_csv(folder_export + 'vehiculeDto.csv', index=False)
valeursNonEnBourseDto.reset_index().to_csv(folder_export + 'valeursNonEnBourseDto.csv', index=False)
autreBienDto.reset_index().to_csv(folder_export + 'autreBienDto.csv', index=False)
bienEtrangerDto.reset_index().to_csv(folder_export + 'bienEtrangerDto.csv', index=False)
observationPatrimoineDto.reset_index().to_csv(folder_export + 'observationPatrimoineDto.csv', index=False)
bienDiverDto.reset_index().to_csv(folder_export + 'bienDiverDto.csv', index=False)
fondDto.reset_index().to_csv(folder_export + 'fondDto.csv', index=False)