### 1. Import modules

In [1]:
import warnings
warnings.filterwarnings('ignore')

import pandas as pd

### 2. Import schoolgaanden to Pandas dataframe

In [2]:
# Import pickles
df_zuigelingen = pd.read_pickle('4_Data\Pickles\zuigelingen_observaties.pkl')

# Save only columns PersonNr and Postcode
df_zuigelingen_buurt = df_zuigelingen[['Clientnummer', 'BuurtCode']]

In [3]:
# Print missingness percentages in the data
print(df_zuigelingen_buurt.isnull().mean())

Clientnummer    0.0
BuurtCode       0.0
dtype: float64


### 3. Import CBS .csv

In [4]:
# Reading csv to pandas dataframe
input_file = '4_Data\Kerncijfers_wijken_en_buurten_2022_25062024_152855.csv'
cbs_df = pd.read_csv(input_file, delimiter=';')

In [5]:
# Rename Regioaanduiding/Codering (code) to CBS_Buurtcode_BRP
cbs_df.rename(columns={'Regioaanduiding/Codering (code)': 'BuurtCode'}, inplace=True)

# From CBS_Buurtcode_BRP remove first two characters if they are 'BU'
cbs_df['BuurtCode'] = cbs_df['BuurtCode'].apply(lambda x: x[2:] if x[:2] == 'BU' else x)

# Merge
zuigelingen_buurt = pd.merge(df_zuigelingen_buurt, cbs_df, on='BuurtCode', how='left')

# Drop columns postcode and geometry
zuigelingen_buurt = zuigelingen_buurt.drop(columns=['BuurtCode', 'Wijken en buurten'])

# Set Clietnummer dtype to object
zuigelingen_buurt['Clientnummer'] = zuigelingen_buurt['Clientnummer'].astype('str')

# Print the amount of NaN values per column as percentages
print(zuigelingen_buurt.isna().sum() / len(zuigelingen_buurt) * 100)

Clientnummer                                                                                           0.000000
Bevolking/Aantal inwoners (aantal)                                                                     0.000000
Bevolking/Burgerlijke staat/Gehuwd (aantal)                                                            0.000000
Bevolking/Burgerlijke staat/Gescheiden (aantal)                                                        0.000000
Bevolking/Personen met een migratieachtergrond/Niet-westers/Marokko (aantal)                           0.000000
Bevolking/Personen met een migratieachtergrond/Niet-westers/Nederlandse Antillen en Aruba (aantal)     0.000000
Bevolking/Personen met een migratieachtergrond/Niet-westers/Suriname (aantal)                          0.000000
Bevolking/Personen met een migratieachtergrond/Niet-westers/Turkije (aantal)                           0.000000
Bevolking/Personen met een migratieachtergrond/Niet-westers/Overig niet-westers (aantal)               0

In [6]:
len(zuigelingen_buurt)

5384

### 4. Save .pkl's

In [7]:
# Save as a pickle
zuigelingen_buurt.to_pickle('4_Data\Pickles\zuigelingen_buurt.pkl')