In [1]:
import sys
sys.path.append('../1_format/')
sys.path.append('../2_analyse/')

In [2]:
import pandas as pd
import requests
import json
import matplotlib.pyplot as plt
import plotly.graph_objects as go
import seaborn
import numpy as np
import glob
import geopandas
from matplotlib.pyplot import figure
seaborn.set()

In [3]:
pd.set_option('display.max_columns', None)

### Format BODACC

In [38]:
df_bodacc = pd.read_csv('../0_data/annonces-commerciales.csv', 
                        usecols=['id', 'dateparution', 'numeroannonce', 'jugement', 'numerodepartement', 'region_code',
                                 'tribunal', 'commercant', 'ville', 'registre'],
                        sep=';')

In [39]:
# get jugement info
df_bodacc = df_bodacc.dropna(subset='jugement')
df_bodacc['jugement_nature'] = df_bodacc['jugement'].apply(lambda x: json.loads(x)['nature'])
df_bodacc['jugement_famille'] = df_bodacc['jugement'].apply(lambda x: json.loads(x)['famille'])
df_bodacc['jugement_date'] = df_bodacc['jugement'].apply(lambda x: json.loads(x)['date'] if 'date' in json.loads(x) else '')
df_bodacc['jugement_complement'] = df_bodacc['jugement'].apply(lambda x: json.loads(x)['complementJugement'] 
                                                               if 'complementJugement' in json.loads(x) else '')
df_bodacc = df_bodacc.drop('jugement', axis=1)

In [40]:
# fix error import
df_bodacc['jugement_famille'] = df_bodacc['jugement_famille'].replace('Jugement prononÃ§ant', 'Jugement prononçant')
df_bodacc['jugement_famille'] = df_bodacc['jugement_famille'].replace('Avis de dÃ©pÃ´t', 'Avis de dépôt')
df_bodacc['jugement_famille'] = df_bodacc['jugement_famille'].replace('Jugement de clÃ´ture', 'Jugement de clôture')
df_bodacc['jugement_famille'] = df_bodacc['jugement_famille'].replace("ArrÃªt de la Cour d'Appel", "Arrêt de la Cour d'Appel")

In [41]:
# get rid of null siren with no info
df_bodacc = df_bodacc.dropna(subset='registre')
df_bodacc['registre'] = df_bodacc['registre'].astype(str)
df_bodacc['registre'] = df_bodacc['registre'].apply(lambda x : x.replace('000 000 000,000000000,', ''))
df_bodacc = df_bodacc[df_bodacc['registre'] != '000 000 000,000000000']

In [42]:
# extract SIREN
df_bodacc['SIREN'] = df_bodacc['registre'].apply(lambda x: x.split(',')[0].replace(' ', ''))
df_bodacc = df_bodacc.drop('registre', axis=1)

In [43]:
# format dates
df_bodacc['dateparution'] = pd.to_datetime(df_bodacc['dateparution'])
df_bodacc['jugement_date'] = pd.to_datetime(df_bodacc['jugement_date'], format='mixed', dayfirst=True, errors='ignore')

In [44]:
df_bodacc = df_bodacc.sort_values(by=['dateparution', 'SIREN'])

In [45]:
len(df_bodacc)

2451404

In [46]:
len(df_bodacc.SIREN.unique())

900242

In [47]:
# keep only relevant categories
df_bodacc = df_bodacc.loc[(df_bodacc['jugement_famille'] != 'Rétractation sur tierce opposition') & 
                          (df_bodacc['jugement_famille'] != 'Loi de 1967') &
                          (df_bodacc['jugement_famille'] != "Arrêt de la Cour d'Appel")]

In [48]:
# convert to simple sub categories of judgements
df_bodacc.loc[(df_bodacc['jugement_famille'] == 'Jugement prononçant') & (df_bodacc['jugement_nature'] != 'Jugement de conversion en liquidation judiciaire'), 'jugement_nature'] = 'Autre jugement'
df_bodacc.loc[(df_bodacc['jugement_famille'] == 'Jugement de clôture') & (df_bodacc['jugement_nature'] != "Jugement de clôture pour insuffisance d'actif"), 'jugement_nature'] = 'Autre jugement'
df_bodacc.loc[(df_bodacc['jugement_famille'] == "Jugement d'ouverture") & ((df_bodacc['jugement_nature'] != "Jugement d'ouverture de liquidation judiciaire") & (df_bodacc['jugement_nature'] != "Jugement d'ouverture d'une procédure de redressement judiciaire")), 'jugement_nature'] = 'Autre jugement'
df_bodacc.loc[(df_bodacc['jugement_famille'] == "Avis de dépôt") & (df_bodacc['jugement_nature'] != "Dépôt de l'état des créances"), 'jugement_nature'] = 'Autre jugement'

In [49]:
# simplify jugemetn nature for ouverture
df_bodacc.loc[df_bodacc['jugement_nature'] == "Jugement d'ouverture de liquidation judiciaire", "jugement_famille"] = "Jugement d'ouverture de liquidation"
df_bodacc.loc[df_bodacc['jugement_nature'] == "Jugement d'ouverture d'une procédure de redressement judiciaire", "jugement_famille"] = "Jugement d'ouverture de redressement"
df_bodacc.loc[df_bodacc['jugement_nature'] == "Autre jugement", "jugement_famille"] = "Jugement d'ouverture autre"

In [50]:
len(df_bodacc)

2443796

In [52]:
df_bodacc = df_bodacc[(df_bodacc.jugement_date > '2020-01-01')]
 # format other type of date TO FIX
df_bodacc['year'] = df_bodacc['jugement_date'].apply(lambda x: str(x)[:4])
df_bodacc = df_bodacc[df_bodacc['year'].isin(['2020', '2021', '2022', '2023'])]

In [53]:
df_bodacc = df_bodacc[df_bodacc.numerodepartement.isin(['75', '77', '78', '91', '92', '93', '94', '95'])]

In [54]:
len(df_bodacc)

84549

### Format BODACC liquidation

In [55]:
df_bodacc_liq = df_bodacc[df_bodacc.jugement_famille == "Jugement d'ouverture de liquidation"].drop_duplicates('SIREN',
                                                                                                               keep='last')

In [56]:
len(df_bodacc_liq)

21544

In [57]:
df_bodacc_liq.head(3)

Unnamed: 0,id,dateparution,numeroannonce,numerodepartement,region_code,tribunal,commercant,ville,jugement_nature,jugement_famille,jugement_date,jugement_complement,SIREN,year
2034846,A201800912458,2018-05-15,2458,92,11.0,TRIBUNAL DE COMMERCE DE NANTERRE,GRENELLE EVENTS,Paris,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-05-03,"Jugement prononçant la liquidation judiciaire,...",820473312,2020
2094554,A202000111863,2020-01-16,1863,91,11.0,TRIBUNAL DE COMMERCE D'EVRY,TRIVIUM CONSEIL,Mennecy,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-01-06,"Jugement prononçant la liquidation judiciaire,...",347896128,2020
177512,A202000111777,2020-01-16,1777,77,11.0,TRIBUNAL DE COMMERCE DE MELUN,TSG,Vaux-le-Pénil,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-01-06,"Jugement prononçant la liquidation judiciaire,...",377517057,2020


### Import other bases

In [58]:
# get SIREN of companies that are PM
SIREN = pd.read_csv('../0_data/base_sirene/StockUniteLegale_utf8.csv', 
                    usecols=['siren', 'denominationUniteLegale', 'prenom1UniteLegale'],
                    dtype = {'siren': str})
SIREN = SIREN[SIREN.prenom1UniteLegale.isna()]

  SIREN = pd.read_csv('../0_data/base_sirene/StockUniteLegale_utf8.csv',


In [59]:
df_bodacc_liq = df_bodacc_liq[df_bodacc_liq.SIREN.isin(list(SIREN.siren))]

In [60]:
len(df_bodacc_liq)

20928

In [61]:
df_parc1 = pd.concat([pd.read_csv(i,
                                  sep=';',
                                  encoding='latin',
                                  low_memory=False,
                                  dtype={'Département (Champ géographique)' : str,
                                         'Code Direction (Champ géographique)' : str,
                                         'Code Commune (Champ géographique)' : str,
                                         'Préfixe (Références cadastrales)' : str,
                                         'Section (Références cadastrales)' : str,
                                         'N° plan (Références cadastrales)' : str}) for i in glob.glob(
    "../0_data/parcelles/Fichier des parcelles (situation 2022)-dept 01 à 61/Fichier des parcelles (situation 2022)-dpts 01 à 61/*.txt", recursive=True)])

df_parc2 = pd.concat([pd.read_csv(i, sep=';',
                                  encoding='latin',
                                  low_memory=False,
                                  dtype={'Département (Champ géographique)' : str,
                                         'Code Direction (Champ géographique)' : str,
                                         'Code Commune (Champ géographique)' : str,
                                         'Préfixe (Références cadastrales)' : str,
                                         'Section (Références cadastrales)' : str,
                                         'N° plan (Références cadastrales)' : str}) for i in glob.glob(
    "../0_data/parcelles/Fichier des parcelles (situation 2022)-dept 62 à 976/Fichier des parcelles (situation 2022)-dpts 62 à 976/*.txt", recursive=True)])

df_parc = pd.concat([df_parc1, df_parc2], axis=0)

In [62]:
df_loc = pd.concat([pd.read_csv(i,
                                sep=';',
                                encoding='latin',
                                low_memory=False,
                                dtype={'Département (Champ géographique)' : str,
                                         'Code Direction (Champ géographique)' : str,
                                         'Code Commune (Champ géographique)' : str,
                                         'Préfixe (Références cadastrales)' : str,
                                         'Section (Références cadastrales)' : str,
                                         'N° plan (Références cadastrales)' : str}) for i in glob.glob(
    "../0_data/locaux/Fichier des locaux/*.txt",
    recursive=True)])

In [63]:
SIRET = pd.read_csv('../0_data/base_sirene/StockEtablissement_utf8.csv',
                    usecols=['siren', 'siret', 'libelleVoieEtablissement', 'libelleCommuneEtablissement'],
                    dtype = {'siren': str, 'siret': str, 'libelleVoieEtablissement': str, 'libelleCommuneEtablissement': str})

### Analysis

In [64]:
df = df_bodacc_liq.copy()

#### With parcelles

In [65]:
parc_bodacc = df.merge(df_parc, left_on='SIREN',
                       right_on = 'N° SIREN (Propriétaire(s) parcelle)',
                       how='left')

In [66]:
parc_bodacc = parc_bodacc[~parc_bodacc['N° SIREN (Propriétaire(s) parcelle)'].isna()]
parc_bodacc = parc_bodacc.drop_duplicates(['SIREN', 'jugement_date', 'Département (Champ géographique)', 
                                           'Code Commune (Champ géographique)', 'Section (Références cadastrales)',
                                           'Préfixe (Références cadastrales)', 'N° plan (Références cadastrales)'])

In [67]:
parc_bodacc

Unnamed: 0,id,dateparution,numeroannonce,numerodepartement,region_code,tribunal,commercant,ville,jugement_nature,jugement_famille,jugement_date,jugement_complement,SIREN,year,Département (Champ géographique),Code Direction (Champ géographique),Code Commune (Champ géographique),Nom Commune (Champ géographique),Préfixe (Références cadastrales),Section (Références cadastrales),N° plan (Références cadastrales),N° de voirie (Adresse parcelle),Indice de répétition (Adresse parcelle),Code voie MAJIC (Adresse parcelle),Code voie rivoli (Adresse parcelle),Nature voie (Adresse parcelle),Nom voie (Adresse parcelle),Contenance (Caractéristiques parcelle),SUF (Evaluation SUF),Nature culture (Evaluation SUF),Contenance (Evaluation SUF),Code droit (Propriétaire(s) parcelle),N° MAJIC (Propriétaire(s) parcelle),N° SIREN (Propriétaire(s) parcelle),Groupe personne (Propriétaire(s) parcelle),Forme juridique (Propriétaire(s) parcelle),Forme juridique abrégée (Propriétaire(s) parcelle),Dénomination (Propriétaire(s) parcelle)
965,A202000372626,2020-02-21,2626,93,11.0,TRIBUNAL DE COMMERCE DE BOBIGNY,NISHA,Épinay-sur-Seine,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-02-12,"Jugement prononçant la liquidation judiciaire,...",490874112,2020,13,2,112,VELAUX,,CT,0066,,,405.0,B186,,GRAND PONT,564.0,,S,564.0,P,PBHTZX,490874112,0,5499,SARL,NISHA
966,A202000372626,2020-02-21,2626,93,11.0,TRIBUNAL DE COMMERCE DE BOBIGNY,NISHA,Épinay-sur-Seine,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-02-12,"Jugement prononçant la liquidation judiciaire,...",490874112,2020,13,2,112,VELAUX,,CT,0067,,,405.0,B186,,GRAND PONT,1054.0,,S,1054.0,P,PBHTZX,490874112,0,5499,SARL,NISHA
1420,A202000512680,2020-03-12,2680,75,11.0,TRIBUNAL DE COMMERCE DE PARIS,SARL HAMPTON,Paris,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-02-25,"Jugement prononçant la liquidation judiciaire,...",380746313,2020,60,0,141,CHANTILLY,,AE,0492,26.0,,77.0,0150,RUE,DES CASCADES,582.0,,AB,582.0,P,PBCL2T,380746313,0,5499,SARL,HAMPTON
1421,A202000512680,2020-03-12,2680,75,11.0,TRIBUNAL DE COMMERCE DE PARIS,SARL HAMPTON,Paris,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-02-25,"Jugement prononçant la liquidation judiciaire,...",380746313,2020,60,0,141,CHANTILLY,,AE,0493,26.0,,77.0,0150,RUE,DES CASCADES,263.0,,S,263.0,P,PBCL2T,380746313,0,5499,SARL,HAMPTON
1890,A202000641286,2020-03-31,1286,75,11.0,TRIBUNAL DE COMMERCE DE PARIS,SCI LES JARDINS DE CANDICE,Paris,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-03-13,"Jugement prononçant la liquidation judiciaire,...",530781509,2020,77,0,114,CHEVRY-COSSIGNY,,AB,0032,,,100.0,0120,RUE,CHARLES PATHE,1089.0,,AB,1089.0,S,PBFP2S,530781509,0,6540,SCI,SCI LES JARDINS DE CANDICE
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
21468,A202301002246,2023-05-25,2246,78,11.0,Greffe du Tribunal de Commerce de Versailles,SH L'ESPERANCE,Saint-Père,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2023-05-16,"Jugement prononçant la liquidation judiciaire,...",820222214,2023,89,0,364,SAINT PERE,,AB,0721,,,183.0,B185,,LE VILLAGE,1812.0,,AG,1812.0,P,PBCWT4,820222214,0,5710,SAS,SH LESPERANCE
21469,A202301002246,2023-05-25,2246,78,11.0,Greffe du Tribunal de Commerce de Versailles,SH L'ESPERANCE,Saint-Père,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2023-05-16,"Jugement prononçant la liquidation judiciaire,...",820222214,2023,89,0,364,SAINT PERE,,AB,0794,,,69.0,B070,,L ENFERMIE,35.0,,S,35.0,P,PBCWT4,820222214,0,5710,SAS,SH LESPERANCE
21470,A202301002246,2023-05-25,2246,78,11.0,Greffe du Tribunal de Commerce de Versailles,SH L'ESPERANCE,Saint-Père,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2023-05-16,"Jugement prononçant la liquidation judiciaire,...",820222214,2023,89,0,364,SAINT PERE,,AB,0943,,,69.0,B070,,L ENFERMIE,24.0,,J,24.0,P,PBCWT4,820222214,0,5710,SAS,SH LESPERANCE
21471,A202301002246,2023-05-25,2246,78,11.0,Greffe du Tribunal de Commerce de Versailles,SH L'ESPERANCE,Saint-Père,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2023-05-16,"Jugement prononçant la liquidation judiciaire,...",820222214,2023,89,0,364,SAINT PERE,,AB,0951,,,69.0,B070,,L ENFERMIE,599.0,,J,599.0,P,PBCWT4,820222214,0,5710,SAS,SH LESPERANCE


In [68]:
print('Number of parcelles concerned :', len(parc_bodacc))

Number of parcelles concerned : 675


In [69]:
print('Number of companies concerned :', len(parc_bodacc.SIREN.unique()))

Number of companies concerned : 118


In [70]:
parc_bodacc['Préfixe (Références cadastrales)'] = parc_bodacc['Section (Références cadastrales)'].apply(lambda x: '000' if len(x) == 2 else '0000')
parc_bodacc['parcelle_id'] = parc_bodacc['Département (Champ géographique)'] + parc_bodacc['Code Commune (Champ géographique)'] + parc_bodacc['Préfixe (Références cadastrales)'] + parc_bodacc['Section (Références cadastrales)']  + parc_bodacc['N° plan (Références cadastrales)']

In [71]:
list_cities = ['ALFORTVILLE', 'CHAMPIGNY SUR MARNE', 'FONTENAY SOUS BOIS',
               'ST MAUR DES FOSSES', 'ASNIERES-SUR-SEINE', 'CLICHY', 'LIVRY GARGAN']

parc_bodacc[parc_bodacc['Nom Commune (Champ géographique)'].isin(list_cities)]

Unnamed: 0,id,dateparution,numeroannonce,numerodepartement,region_code,tribunal,commercant,ville,jugement_nature,jugement_famille,jugement_date,jugement_complement,SIREN,year,Département (Champ géographique),Code Direction (Champ géographique),Code Commune (Champ géographique),Nom Commune (Champ géographique),Préfixe (Références cadastrales),Section (Références cadastrales),N° plan (Références cadastrales),N° de voirie (Adresse parcelle),Indice de répétition (Adresse parcelle),Code voie MAJIC (Adresse parcelle),Code voie rivoli (Adresse parcelle),Nature voie (Adresse parcelle),Nom voie (Adresse parcelle),Contenance (Caractéristiques parcelle),SUF (Evaluation SUF),Nature culture (Evaluation SUF),Contenance (Evaluation SUF),Code droit (Propriétaire(s) parcelle),N° MAJIC (Propriétaire(s) parcelle),N° SIREN (Propriétaire(s) parcelle),Groupe personne (Propriétaire(s) parcelle),Forme juridique (Propriétaire(s) parcelle),Forme juridique abrégée (Propriétaire(s) parcelle),Dénomination (Propriétaire(s) parcelle),parcelle_id
5652,A202100024350,2021-01-05,4350,75,11.0,TRIBUNAL DE COMMERCE DE PARIS,CABINET ROLET-BONTEMPS,Paris,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-12-17,"Jugement prononçant la liquidation judiciaire,...",331153676,2020,92,1,24,CLICHY,0,Q,68,56.0,,110.0,7130,RUE,DE PARIS,288.0,,S,288.0,G,PBFS74,331153676,0,5710,SAS,CABINET ROLET BONTEMPS,920240000Q0068
5653,A202100024350,2021-01-05,4350,75,11.0,TRIBUNAL DE COMMERCE DE PARIS,CABINET ROLET-BONTEMPS,Paris,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-12-17,"Jugement prononçant la liquidation judiciaire,...",331153676,2020,92,1,24,CLICHY,0,Q,69,71.0,,70.0,4420,RUE,HENRI BARBUSSE,354.0,,S,354.0,G,PBFS74,331153676,0,5710,SAS,CABINET ROLET BONTEMPS,920240000Q0069
5654,A202100024350,2021-01-05,4350,75,11.0,TRIBUNAL DE COMMERCE DE PARIS,CABINET ROLET-BONTEMPS,Paris,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-12-17,"Jugement prononçant la liquidation judiciaire,...",331153676,2020,92,1,24,CLICHY,0,Q,148,75.0,,70.0,4420,RUE,HENRI BARBUSSE,280.0,,S,280.0,G,PBFS74,331153676,0,5710,SAS,CABINET ROLET BONTEMPS,920240000Q0148
5655,A202100024350,2021-01-05,4350,75,11.0,TRIBUNAL DE COMMERCE DE PARIS,CABINET ROLET-BONTEMPS,Paris,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-12-17,"Jugement prononçant la liquidation judiciaire,...",331153676,2020,92,1,24,CLICHY,0,Q,179,75.0,,70.0,4420,RUE,HENRI BARBUSSE,290.0,,S,290.0,G,PBFS74,331153676,0,5710,SAS,CABINET ROLET BONTEMPS,920240000Q0179
7800,A202101032527,2021-05-28,2527,75,11.0,TRIBUNAL DE COMMERCE DE PARIS,PROGESCO,Paris,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2021-05-12,Jugement prononçant la liquidation judiciaire ...,682024542,2021,92,1,4,ASNIERES-SUR-SEINE,0,AQ,163,17.0,,304.0,6660,RUE,DE NORMANDIE,210.0,,S,210.0,S,PBBPVS,682024542,0,5710,SAS,PROGESCO SA,92004000AQ0163
8312,A202101232874,2021-06-25,2874,94,11.0,TRIBUNAL DE COMMERCE DE CRÉTEIL,ADB PATRIMOINE,Saint-Maur-des-Fossés,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2021-06-16,"Jugement prononçant la liquidation judiciaire,...",798531745,2021,94,0,2,ALFORTVILLE,0,Q,178,40.0,,155.0,9621,RUE,VICTOR HUGO,302.0,,S,302.0,S,PBGDMM,798531745,0,5499,SARL,SARL ADB PATRIMOINE,940020000Q0178
8317,A202101232874,2021-06-25,2874,94,11.0,TRIBUNAL DE COMMERCE DE CRÉTEIL,ADB PATRIMOINE,Saint-Maur-des-Fossés,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2021-06-16,"Jugement prononçant la liquidation judiciaire,...",798531745,2021,94,0,68,ST MAUR DES FOSSES,0,AQ,83,1.0,,92.0,760,AV,DE BRAZZA,561.0,,S,561.0,S,PBGDMM,798531745,0,5499,SARL,SARL ADB PATRIMOINE,94068000AQ0083
8318,A202101232874,2021-06-25,2874,94,11.0,TRIBUNAL DE COMMERCE DE CRÉTEIL,ADB PATRIMOINE,Saint-Maur-des-Fossés,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2021-06-16,"Jugement prononçant la liquidation judiciaire,...",798531745,2021,94,0,68,ST MAUR DES FOSSES,0,Q,3,63.0,,355.0,6190,AV,MARINVILLE,716.0,,S,716.0,S,PBGDMM,798531745,0,5499,SARL,SARL ADB PATRIMOINE,940680000Q0003
9929,A202102145791,2021-11-02,5791,75,11.0,TRIBUNAL DE COMMERCE DE PARIS,SAMINVEST 153 SAS,Paris,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2021-10-15,"Jugement prononçant la liquidation judiciaire,...",813869575,2021,94,0,33,FONTENAY SOUS BOIS,0,B,95,107.0,,353.0,7205,RUE,PIERRE CURIE,142.0,,S,142.0,G,PBGG8N,813869575,0,5710,SAS,SAMINVEST 153 SAS,940330000B0095
12121,A202200502673,2022-03-11,2673,75,11.0,Greffe du Tribunal de Commerce de Paris,SAMINVEST 166 SAS,Paris,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2022-02-23,"Jugement prononçant la liquidation judiciaire,...",821688959,2022,94,0,33,FONTENAY SOUS BOIS,0,B,281,39.0,,263.0,5110,RUE,LA FONTAINE,344.0,,S,344.0,P,PBGLW2,821688959,0,5710,SAS,SAMINVEST 166 SAS,940330000B0281


#### With locaux

In [72]:
loc_bodacc = df.merge(df_loc,
                      left_on='SIREN',
                      right_on = 'N° SIREN (Propriétaire(s) du local)',
                      how='left')

In [73]:
loc_bodacc = loc_bodacc[~loc_bodacc['N° SIREN (Propriétaire(s) du local)'].isna()]
loc_bodacc = loc_bodacc.drop_duplicates(['SIREN', 'jugement_date', 'Département (Champ géographique)', 
                                         'Code Commune (Champ géographique)', 'Section (Références cadastrales)',
                                         'Préfixe (Références cadastrales)', 'N° plan (Références cadastrales)'])

In [74]:
loc_bodacc

Unnamed: 0,id,dateparution,numeroannonce,numerodepartement,region_code,tribunal,commercant,ville,jugement_nature,jugement_famille,jugement_date,jugement_complement,SIREN,year,Département (Champ géographique),Code Direction (Champ géographique),Code Commune (Champ géographique),Nom Commune (Champ géographique),Préfixe (Références cadastrales),Section (Références cadastrales),N° plan (Références cadastrales),Bâtiment (Identification du local),Entrée (Identification du local),Niveau (Identification du local),Porte (Identification du local),N° voirie (Adresse du local),Indice de répétition (Adresse du local),Code voie MAJIC (Adresse du local),Code voie rivoli (Adresse du local),Nature voie (Adresse du local),Nom voie (Adresse du local),Code droit (Propriétaire(s) du local),N° MAJIC (Propriétaire(s) du local),N° SIREN (Propriétaire(s) du local),Groupe personne (Propriétaire(s) du local),Forme juridique (Propriétaire(s) du local),Forme juridique abrégée (Propriétaire(s) du local),Dénomination (Propriétaire(s) du local)
961,A202000372709,2020-02-21,2709,94,11.0,TRIBUNAL JUDICIAIRE DE CRÉTEIL,LORENA ET ROGER,Alfortville,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-02-02,Jugement d’ouverture d’une procédure de liquid...,450630488,2020,94,0,046,MAISONS ALFORT,,AI,0114,A,02,0.0,2001.0,9001.0,,84.0,2585,,RES DULAC PLAISANCE,P,PBBRBQ,450630488,0,6540,SCI,LORENA ET ROGER
966,A202000372626,2020-02-21,2626,93,11.0,TRIBUNAL DE COMMERCE DE BOBIGNY,NISHA,Épinay-sur-Seine,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-02-12,"Jugement prononçant la liquidation judiciaire,...",490874112,2020,13,2,112,VELAUX,,CT,0066,E,01,0.0,1001.0,2105.0,,423.0,4204,AV,JEAN PALLET,P,PBHTZX,490874112,0,5499,SARL,NISHA
1048,A202000381625,2020-02-23,1625,92,11.0,TRIBUNAL DE COMMERCE DE NANTERRE,OLESTRE GESTION,Courbevoie,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-02-13,"Jugement prononçant la liquidation judiciaire,...",530316231,2020,75,6,108,PARIS 08,,BI,0087,A,01,1.0,2001.0,20.0,,149.0,4921,RUE,JEAN MERMOZ,G,PBN3TJ,530316231,0,5710,SAS,OLESTRE GESTION
1049,A202000381625,2020-02-23,1625,92,11.0,TRIBUNAL DE COMMERCE DE NANTERRE,OLESTRE GESTION,Courbevoie,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-02-13,"Jugement prononçant la liquidation judiciaire,...",530316231,2020,92,1,044,LEVALLOIS PERRET,,R,0034,A,01,2.0,2001.0,55.0,,58.0,4785,RUE,JULES GUESDE,G,PBHSFM,530316231,0,5710,SAS,OLESTRE GESTION
1052,A202000381625,2020-02-23,1625,92,11.0,TRIBUNAL DE COMMERCE DE NANTERRE,OLESTRE GESTION,Courbevoie,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2020-02-13,"Jugement prononçant la liquidation judiciaire,...",530316231,2020,92,1,044,LEVALLOIS PERRET,,V,0184,01,01,0.0,1001.0,23.0,,73.0,6140,RUE,MARIUS AUFAN,G,PBHSFM,530316231,0,5710,SAS,OLESTRE GESTION
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
21730,A202301002246,2023-05-25,2246,78,11.0,Greffe du Tribunal de Commerce de Versailles,SH L'ESPERANCE,Saint-Père,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2023-05-16,"Jugement prononçant la liquidation judiciaire,...",820222214,2023,89,0,364,SAINT PERE,,AB,0010,A,01,0.0,1001.0,25.0,,200.0,0160,GR,GRANDE RUE,P,PBCWT4,820222214,0,5710,SAS,SH LESPERANCE
21731,A202301002246,2023-05-25,2246,78,11.0,Greffe du Tribunal de Commerce de Versailles,SH L'ESPERANCE,Saint-Père,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2023-05-16,"Jugement prononçant la liquidation judiciaire,...",820222214,2023,89,0,364,SAINT PERE,,AB,0502,A,01,0.0,1001.0,22.0,,200.0,0160,GR,GRANDE RUE,P,PBCWT4,820222214,0,5710,SAS,SH LESPERANCE
21732,A202301002246,2023-05-25,2246,78,11.0,Greffe du Tribunal de Commerce de Versailles,SH L'ESPERANCE,Saint-Père,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2023-05-16,"Jugement prononçant la liquidation judiciaire,...",820222214,2023,89,0,364,SAINT PERE,,AB,0508,A,01,0.0,1001.0,22.0,A,200.0,0160,GR,GRANDE RUE,P,PBCWT4,820222214,0,5710,SAS,SH LESPERANCE
21733,A202301002246,2023-05-25,2246,78,11.0,Greffe du Tribunal de Commerce de Versailles,SH L'ESPERANCE,Saint-Père,Jugement d'ouverture de liquidation judiciaire,Jugement d'ouverture de liquidation,2023-05-16,"Jugement prononçant la liquidation judiciaire,...",820222214,2023,89,0,364,SAINT PERE,,AB,0677,A,01,0.0,1001.0,1.0,,225.0,0105,RLE,DE L ENFERMIE,P,PBCWT4,820222214,0,5710,SAS,SH LESPERANCE


In [75]:
print('Number of locaux concerned :', len(loc_bodacc))

Number of locaux concerned : 340


In [76]:
loc_bodacc['Préfixe (Références cadastrales)'] = loc_bodacc['Section (Références cadastrales)'].apply(lambda x: '000' if len(x) == 2 else '0000')
df_loc['Préfixe (Références cadastrales)'] = df_loc['Section (Références cadastrales)'].apply(lambda x: '000' if len(str(x)) == 2 else '0000')

loc_bodacc['parcelle_id'] = loc_bodacc['Département (Champ géographique)'] + loc_bodacc['Code Commune (Champ géographique)']+ loc_bodacc['Préfixe (Références cadastrales)'] + loc_bodacc['Section (Références cadastrales)']  + loc_bodacc['N° plan (Références cadastrales)']
df_loc['parcelle_id'] = df_loc['Département (Champ géographique)'] + df_loc['Code Commune (Champ géographique)'] + df_loc['Préfixe (Références cadastrales)']  + df_loc['Section (Références cadastrales)'] + df_loc['N° plan (Références cadastrales)']

In [77]:
df_loc_perimetre = df_loc[df_loc['parcelle_id'].isin(loc_bodacc['parcelle_id'].unique())]
count_per_loc = df_loc_perimetre[['parcelle_id','N° SIREN (Propriétaire(s) du local)']].groupby('parcelle_id').count()
print('Proportion of locaux  where there is unique SIREN in it: ',
      round(100*len(count_per_loc[count_per_loc['N° SIREN (Propriétaire(s) du local)']!=1])/len(count_per_loc),2), '%' )

Proportion of locaux  where there is unique SIREN in it:  80.95 %


#### With SIRET

In [193]:
siret_bodacc = df.merge(SIRET, left_on='SIREN',
                               right_on = 'siren',
                               how='left')

In [194]:
len(siret_bodacc)

38262

In [195]:
siret_bodacc_loc = siret_bodacc.merge(loc_bodacc, how='left',
                                      left_on=['siren', 'libelleVoieEtablissement', 'libelleCommuneEtablissement'],
                                      right_on=['N° SIREN (Propriétaire(s) du local)',
                                                'Nom voie (Adresse du local)', 'Nom Commune (Champ géographique)'])

In [196]:
siret_bodacc_loc = siret_bodacc_loc[['siren', 'siret', 'libelleVoieEtablissement', 'libelleCommuneEtablissement',
                  'Code Commune (Champ géographique)', 'Nom Commune (Champ géographique)',
                  'Bâtiment (Identification du local)',
                  'Entrée (Identification du local)', 'Niveau (Identification du local)',
                  'Porte (Identification du local)', 'N° voirie (Adresse du local)',
                  'Indice de répétition (Adresse du local)',
                  'Code voie MAJIC (Adresse du local)', 'Code voie rivoli (Adresse du local)', 'Nature voie (Adresse du local)',
                  'Nom voie (Adresse du local)', 'Code droit (Propriétaire(s) du local)',
                  'N° MAJIC (Propriétaire(s) du local)',
                  'N° SIREN (Propriétaire(s) du local)',
                  'Groupe personne (Propriétaire(s) du local)',
                  'Forme juridique (Propriétaire(s) du local)',
                  'Forme juridique abrégée (Propriétaire(s) du local)',
                  'Dénomination (Propriétaire(s) du local)', 'parcelle_id']]
siret_bodacc_loc = siret_bodacc_loc[~siret_bodacc_loc['parcelle_id'].isna()]

In [197]:
len(siret_bodacc_loc)

25

In [198]:
siret_bodacc_loc

Unnamed: 0,siren,siret,libelleVoieEtablissement,libelleCommuneEtablissement,Code Commune (Champ géographique),Nom Commune (Champ géographique),Bâtiment (Identification du local),Entrée (Identification du local),Niveau (Identification du local),Porte (Identification du local),N° voirie (Adresse du local),Indice de répétition (Adresse du local),Code voie MAJIC (Adresse du local),Code voie rivoli (Adresse du local),Nature voie (Adresse du local),Nom voie (Adresse du local),Code droit (Propriétaire(s) du local),N° MAJIC (Propriétaire(s) du local),N° SIREN (Propriétaire(s) du local),Groupe personne (Propriétaire(s) du local),Forme juridique (Propriétaire(s) du local),Forme juridique abrégée (Propriétaire(s) du local),Dénomination (Propriétaire(s) du local),parcelle_id
7723,324895788,32489578800010,BARBES,PARIS 18,118,PARIS 18,A,1,81.0,2001.0,42.0,,104.0,0662,BD,BARBES,P,PBG66L,324895788,0,5499,SARL,L ETOILE DE TUNIS,75118000BT0106
7858,799439377,79943937700018,PIERRE BROSSOLETTE,GARGENVILLE,267,GARGENVILLE,A,1,0.0,1002.0,27.0,,184.0,1300,RUE,PIERRE BROSSOLETTE,P,PBGG4H,799439377,0,6540,SCI,SOCIETE CIVILE IMMOBILIERE CMM ET PAR ABREVIAT...,78267000AC0002
7934,488601113,48860111300019,JEAN DE LA FONTAINE,PARIS 16,116,PARIS 16,B,2,5.0,1001.0,85.0,,498.0,5249,RUE,JEAN DE LA FONTAINE,P,PBMPS6,488601113,0,5710,SAS,BALSA-COMPOSITES,75116000BQ0100
12631,451217681,45121768100019,DES CARRIERS ITALIENS,GRIGNY,286,GRIGNY,A,1,0.0,1001.0,16.0,,242.0,0147,RUE,DES CARRIERS ITALIENS,P,PBCJJB,451217681,0,6540,SCI,MOULIN STAR,91286000AP0137
12648,622820447,62282044700036,FONTAINE L EPINE,MORTEAU,411,MORTEAU,A,1,0.0,1001.0,4.0,,141.0,0183,RUE,FONTAINE L EPINE,P,PBCH34,622820447,0,5710,SAS,SOCIETE PAGNOT ET COMPAGNIE,25411000AE0304
15878,419956719,41995671900019,GEORGES MANDEL,PARIS 16,116,PARIS 16,A,1,0.0,1002.0,40.0,,439.0,4141,AV,GEORGES MANDEL,P,PBJJZ7,419956719,0,6540,SCI,LAMARTINE,75116000DV0053
17200,389205592,38920559200097,MARYSE BASTIE,BRON,29,BRON,A,1,0.0,1001.0,16.0,B,166.0,1192,RUE,MARYSE BASTIE,P,PBFPPM,389205592,0,5499,SARL,STARS HOTEL,690290000C1491
17204,389205592,38920559200139,JEAN MOULIN,CHENOVE,166,CHENOVE,A,1,0.0,1001.0,18.0,,121.0,1272,RUE,JEAN MOULIN,P,PBB464,389205592,0,5499,SARL,STARS HOTEL,21166000AT0025
17205,389205592,38920559200139,JEAN MOULIN,CHENOVE,166,CHENOVE,A,1,0.0,1001.0,20.0,,121.0,1272,RUE,JEAN MOULIN,P,PBB464,389205592,0,5499,SARL,STARS HOTEL,21166000AT0026
17535,338276090,33827609000010,DE LA REPUBLIQUE,CHATILLON,20,CHATILLON,A,1,0.0,1001.0,75.0,,169.0,8135,AV,DE LA REPUBLIQUE,P,PBJNWN,338276090,0,5499,SARL,DAS RAVALEMENT,920200000K0128
