# Education Services

## 1. Education Services Data

In [1]:
import pandas as pd

### 1.1. Load datasets

Education Services:

- Schools: *Enseñanza reglada de la ciudad de Barcelona - Open Data BCN*, *Enseñanza no reglada de la ciudad de Barcelona - Open Data BCN*  

- Kindergarten: *Enseñanza infantil de la ciudad de Barcelona - Open Data BCN*

- Libraries: *Espacios con biblioteca o sala de estudio y museísticos de la ciudad de Barcelona - Open Data BCN - 2022*, *Datos de la red de bibliotecas de la ciudad de Barcelona - Open Data BCN*

- Studying Rooms: *Espacios con biblioteca o sala de estudio y museísticos de la ciudad de Barcelona - Open Data BCN - 2022*

- Other: *Listado de equipamientos de educación de la ciudad de Barcelona - Open Data BCN*

In [56]:
import warnings
warnings.filterwarnings("ignore")

In [57]:
import chardet

def detect_encoding(file_path):
    with open(file_path, 'rb') as f:
        result = chardet.detect(f.read())
    return result['encoding']

# Usage
#encoded = detect_encoding(file)
#print(encoded)

In [58]:
#from google.colab import drive
#drive.mount('/content/drive')

In [59]:
# Dataset Files
schools_reglat_file = "opendatabcn_educacio_ensenyament_reglat.csv"
schools_no_reglat_file = "opendatabcn_educacio_ensenyament_no-reglat.csv"
kindergartens_file = "opendatabcn_educacio_ensenyament_infantil.csv"
libraries_studroom_file = "opendatabcn_cultura_biblioteques-i-museus.csv"
libraries_file = "2022_dades_biblioteques.csv"
civic_center_file = "2022_centres_civics_entitats.csv"
education_equip_file = "opendatabcn_llista-equipaments_educacio-csv.csv"

path_files = "/Users/mariatormo02/Desktop/TFG-Code/Data/Education Facilities/"


# Read CSVs
schools_reglat_df = pd.read_csv(path_files + schools_reglat_file, encoding='utf-16')
schools_no_reglat_df = pd.read_csv(path_files + schools_no_reglat_file, encoding='utf-16')
kindergartens_df = pd.read_csv(path_files + kindergartens_file, encoding='utf-16')
libraries_studroom_df = pd.read_csv(path_files + libraries_studroom_file, encoding='utf-16')
libraries_df = pd.read_csv(path_files + libraries_file, encoding='utf-8')
#civic_centers_df = pd.read_csv(path_files + civic_center_file, encoding='utf-8')
education_equip_df = pd.read_csv(path_files + education_equip_file, encoding='utf-16')

### 1.2. Dataset Analysis

In [62]:
# Functions Definition
def null_function (df):
    # Extract columns without nulls
    non_null_cols = df.columns[df.notnull().all()]

    # Extract columns with nulls
    null_cols = df.columns[df.isnull().any()]

    # Get count and percentage of null values for columns with nulls
    null_count = df[null_cols].isnull().sum()
    null_percentage = (null_count / len(df)) * 100

    # Combine information into a DataFrame
    info_df = pd.DataFrame({
        'Column': null_count.index,
        'Null Count': null_count.values,
        'Null Percentage': null_percentage.values
    })
    return non_null_cols, info_df

def has_duplicates(df, col_name):
    if df[col_name].duplicated().any():
        print("There's duplicate values in column", col_name)
    else:
        print("No duplicate values in column", col_name)

#### 1) Regulated Education Institutions

In [63]:
display(schools_reglat_df.info())
print("\nSTATISTICS:\n")
#display(schools_reglat_df.describe())
non_null_cols, info_df = null_function(schools_reglat_df)
print("\nColumns with no null values:", non_null_cols)
print("\nColumns with null values:")
display(info_df)

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1383 entries, 0 to 1382
Data columns (total 39 columns):
 #   Column                         Non-Null Count  Dtype  
---  ------                         --------------  -----  
 0   register_id                    1383 non-null   object 
 1   name                           1383 non-null   object 
 2   institution_id                 87 non-null     float64
 3   institution_name               87 non-null     object 
 4   created                        1383 non-null   object 
 5   modified                       1383 non-null   object 
 6   addresses_roadtype_id          0 non-null      float64
 7   addresses_roadtype_name        0 non-null      float64
 8   addresses_road_id              1381 non-null   float64
 9   addresses_road_name            1381 non-null   object 
 10  addresses_start_street_number  1381 non-null   float64
 11  addresses_end_street_number    100 non-null    float64
 12  addresses_neighborhood_id      1381 non-null   f

None


STATISTICS:


Columns with no null values: Index(['register_id', 'name', 'created', 'modified', 'addresses_main_address',
       'secondary_filters_id', 'secondary_filters_name',
       'secondary_filters_fullpath', 'secondary_filters_tree',
       'secondary_filters_asia_id', 'geo_epgs_25831_x', 'geo_epgs_25831_y',
       'geo_epgs_4326_lat', 'geo_epgs_4326_lon'],
      dtype='object')

Columns with null values:


Unnamed: 0,Column,Null Count,Null Percentage
0,institution_id,1296,93.709328
1,institution_name,1296,93.709328
2,addresses_roadtype_id,1383,100.0
3,addresses_roadtype_name,1383,100.0
4,addresses_road_id,2,0.144613
5,addresses_road_name,2,0.144613
6,addresses_start_street_number,2,0.144613
7,addresses_end_street_number,1283,92.769342
8,addresses_neighborhood_id,2,0.144613
9,addresses_neighborhood_name,2,0.144613


*Seeing the amount of NULL values for each column, we will drop: institution_id, institution_name, addresses_roadtype_id, addresses_roadtype_name	, addresses_end_street_number, addresses_type, values_description, estimated_dates, start_date, end_date. Also, the columns created and modified won't be used for the moment.*

In [64]:
# Drop columns with almost all null values
columns_to_drop_schools_reglat = ['created', 'modified', 'institution_id', 'institution_name', 'addresses_roadtype_id', 'addresses_roadtype_name' ,
                                  'addresses_end_street_number', 'addresses_type', 'values_description', 'estimated_dates', 'start_date', 'end_date']

schools_reglat_df.drop(columns=columns_to_drop_schools_reglat, inplace=True)

# Useless: Identifiador Via, Indicador si l'adreça, Valor de l'atribut identificador, Valor de l'atribut, Valors d'atribut Destacat,
# Arbres d'equivalència Identificador, Arbres d'equivalència Ruta, Arbres d'equivalència, Arbres d'equivalència  Id Asia
useless_cols = ['addresses_road_id', 'addresses_main_address', 'values_id', 'values_attribute_id', 'values_outstanding', 'secondary_filters_id',
                'secondary_filters_fullpath', 'secondary_filters_tree', 'secondary_filters_asia_id', 'values_category', 'values_attribute_name']
schools_reglat_df.drop(columns=useless_cols, inplace=True)
schools_reglat_df.head(10)

Unnamed: 0,register_id,name,addresses_road_name,addresses_start_street_number,addresses_neighborhood_id,addresses_neighborhood_name,addresses_district_id,addresses_district_name,addresses_zip_code,addresses_town,values_value,secondary_filters_name,geo_epgs_25831_x,geo_epgs_25831_y,geo_epgs_4326_lat,geo_epgs_4326_lon
0,﻿92086000496,Facultat d'Informació i Mitjans Audiovisuals - UB,Melcior de Palau,140.0,18.0,Sants,3.0,Sants-Montjuïc,8014.0,BARCELONA,934035770,Universitats,427989.387049,4581443.0,41.381286,2.138788
1,﻿92086008555,Institut Fort Pius,C Ausiàs Marc,78.0,5.0,el Fort Pienc,2.0,Eixample,8013.0,BARCELONA,932316013,Educació secundària,431433.01228,4582861.0,41.394359,2.179807
2,﻿75990047979,Escola Pia de Nostra Senyora,Carrer de la Diputació,277.0,7.0,la Dreta de l'Eixample,2.0,Eixample,8007.0,Barcelona,934881166,Educació secundària,430435.525044,4582521.0,41.391216,2.167916
3,﻿75990047979,Escola Pia de Nostra Senyora,Carrer de la Diputació,277.0,7.0,la Dreta de l'Eixample,2.0,Eixample,8007.0,Barcelona,934881166,Formació professional,430435.525044,4582521.0,41.391216,2.167916
4,﻿92168166051,Institut Salvador Seguí,C Santander,7.0,73.0,la Verneda i la Pau,10.0,Sant Martí,8020.0,BARCELONA,933142041,Formació professional,432882.376561,4586038.0,41.423094,2.19679
5,﻿92168166070,Escola de Música Kostka,Rier Can Toda,29.0,30.0,la Salut,6.0,Gràcia,8024.0,BARCELONA,932103605,Música,429568.000936,4585099.0,41.414357,2.15724
6,﻿75990048204,Centre Educatiu Sagrat Cor-Diputació,C Diputació,326.0,7.0,la Dreta de l'Eixample,2.0,Eixample,8009.0,BARCELONA,932656361,Ensenyament infantil (3-6 anys),430973.147727,4582969.0,41.395298,2.174295
7,﻿75990048204,Centre Educatiu Sagrat Cor-Diputació,C Diputació,326.0,7.0,la Dreta de l'Eixample,2.0,Eixample,8009.0,BARCELONA,932656361,Educació primària,430973.147727,4582969.0,41.395298,2.174295
8,﻿75990048204,Centre Educatiu Sagrat Cor-Diputació,C Diputació,326.0,7.0,la Dreta de l'Eixample,2.0,Eixample,8009.0,BARCELONA,932656361,Educació secundària,430973.147727,4582969.0,41.395298,2.174295
9,﻿92168166077,Centre Educatiu Sant Francesc d'Assís,Pl Universitat,2.0,10.0,Sant Antoni,2.0,Eixample,8007.0,BARCELONA,934545954,Ensenyament infantil (3-6 anys),430055.207879,4581855.0,41.385181,2.163444


In [65]:
# Observe New Info
#display(schools_reglat_df.info())

# Check if duplicates
has_duplicates(schools_reglat_df, 'register_id')

There's duplicate values in column register_id


In [66]:
# Print unique values for characteristics column before merging stuff
print("Unique Characteristics:\n")
print(schools_reglat_df['secondary_filters_name'].unique(), "\n")

# Remove weird characteristic (WiFi BCN)
schools_reglat_df = schools_reglat_df[schools_reglat_df['secondary_filters_name'] != 'WiFi BCN']

# Aggregate secondary_filters_name (caract.) by register_id and replace column
aggregated_sec_filters = schools_reglat_df.groupby('register_id')['secondary_filters_name'].transform(lambda x: ', '.join(x))
schools_reglat_df['secondary_filters_name'] = aggregated_sec_filters
#display(schools_reglat_df.head(10))

# Drop duplicated register_id
schools_reglat_df.drop_duplicates(subset='register_id', inplace=True)
display(schools_reglat_df.head(10))

Unique Characteristics:

['Universitats' 'Educació secundària' 'Formació professional' 'Música'
 'Ensenyament infantil (3-6 anys)' 'Educació primària'
 'Ensenyament infantil (0-3 anys)' 'Adults' 'Biblioteques' 'WiFi BCN'
 'Idiomes' "Sales d'estudi" 'Informàtica'] 



Unnamed: 0,register_id,name,addresses_road_name,addresses_start_street_number,addresses_neighborhood_id,addresses_neighborhood_name,addresses_district_id,addresses_district_name,addresses_zip_code,addresses_town,values_value,secondary_filters_name,geo_epgs_25831_x,geo_epgs_25831_y,geo_epgs_4326_lat,geo_epgs_4326_lon
0,﻿92086000496,Facultat d'Informació i Mitjans Audiovisuals - UB,Melcior de Palau,140.0,18.0,Sants,3.0,Sants-Montjuïc,8014.0,BARCELONA,934035770,Universitats,427989.387049,4581443.0,41.381286,2.138788
1,﻿92086008555,Institut Fort Pius,C Ausiàs Marc,78.0,5.0,el Fort Pienc,2.0,Eixample,8013.0,BARCELONA,932316013,Educació secundària,431433.01228,4582861.0,41.394359,2.179807
2,﻿75990047979,Escola Pia de Nostra Senyora,Carrer de la Diputació,277.0,7.0,la Dreta de l'Eixample,2.0,Eixample,8007.0,Barcelona,934881166,"Educació secundària, Formació professional",430435.525044,4582521.0,41.391216,2.167916
4,﻿92168166051,Institut Salvador Seguí,C Santander,7.0,73.0,la Verneda i la Pau,10.0,Sant Martí,8020.0,BARCELONA,933142041,Formació professional,432882.376561,4586038.0,41.423094,2.19679
5,﻿92168166070,Escola de Música Kostka,Rier Can Toda,29.0,30.0,la Salut,6.0,Gràcia,8024.0,BARCELONA,932103605,Música,429568.000936,4585099.0,41.414357,2.15724
6,﻿75990048204,Centre Educatiu Sagrat Cor-Diputació,C Diputació,326.0,7.0,la Dreta de l'Eixample,2.0,Eixample,8009.0,BARCELONA,932656361,"Ensenyament infantil (3-6 anys), Educació prim...",430973.147727,4582969.0,41.395298,2.174295
9,﻿92168166077,Centre Educatiu Sant Francesc d'Assís,Pl Universitat,2.0,10.0,Sant Antoni,2.0,Eixample,8007.0,BARCELONA,934545954,"Ensenyament infantil (3-6 anys), Educació prim...",430055.207879,4581855.0,41.385181,2.163444
11,﻿92168166146,Centre Educatiu Sant Josep,C Montseny,31.0,31.0,la Vila de Gràcia,6.0,Gràcia,8012.0,BARCELONA,932372019,"Ensenyament infantil (0-3 anys), Ensenyament i...",429398.494861,4583769.0,41.402367,2.155367
15,﻿92168166170,Escola Molí de Finestrelles,C Guardiola i Feliu,9.0,60.0,Sant Andreu,9.0,Sant Andreu,8030.0,BARCELONA,933456816,"Ensenyament infantil (3-6 anys), Educació prim...",432294.417917,4587789.0,41.438824,2.189559
17,﻿92168164647,Escola Casas,C Sant Joan de Malta,44.0,65.0,el Clot,10.0,Sant Martí,8018.0,BARCELONA,933004265,"Ensenyament infantil (3-6 anys), Educació prim...",432533.84327,4584418.0,41.408477,2.1928


In [67]:
# Rename Columns
schools_reglat_df = schools_reglat_df.rename(columns={"name": "Name", "addresses_road_name": "Road Name", "addresses_start_street_number": "Street Number",
                                                      "addresses_neighborhood_id": "Neighborhood ID", "addresses_neighborhood_name": "Neighborhood Name",
                                                      "addresses_district_id": "District ID", "addresses_district_name": "District Name",
                                                      "addresses_zip_code": "ZipCode","addresses_town": "Town",
                                                      "values_value": "Phone Number", "secondary_filters_name": "Service Type",
                                                      "geo_epgs_4326_lat": "Latitude", "geo_epgs_4326_lon": "Longitude"})
display(schools_reglat_df.head(10))

Unnamed: 0,register_id,Name,Road Name,Street Number,Neighborhood ID,Neighborhood Name,District ID,District Name,ZipCode,Town,Phone Number,Service Type,geo_epgs_25831_x,geo_epgs_25831_y,Latitude,Longitude
0,﻿92086000496,Facultat d'Informació i Mitjans Audiovisuals - UB,Melcior de Palau,140.0,18.0,Sants,3.0,Sants-Montjuïc,8014.0,BARCELONA,934035770,Universitats,427989.387049,4581443.0,41.381286,2.138788
1,﻿92086008555,Institut Fort Pius,C Ausiàs Marc,78.0,5.0,el Fort Pienc,2.0,Eixample,8013.0,BARCELONA,932316013,Educació secundària,431433.01228,4582861.0,41.394359,2.179807
2,﻿75990047979,Escola Pia de Nostra Senyora,Carrer de la Diputació,277.0,7.0,la Dreta de l'Eixample,2.0,Eixample,8007.0,Barcelona,934881166,"Educació secundària, Formació professional",430435.525044,4582521.0,41.391216,2.167916
4,﻿92168166051,Institut Salvador Seguí,C Santander,7.0,73.0,la Verneda i la Pau,10.0,Sant Martí,8020.0,BARCELONA,933142041,Formació professional,432882.376561,4586038.0,41.423094,2.19679
5,﻿92168166070,Escola de Música Kostka,Rier Can Toda,29.0,30.0,la Salut,6.0,Gràcia,8024.0,BARCELONA,932103605,Música,429568.000936,4585099.0,41.414357,2.15724
6,﻿75990048204,Centre Educatiu Sagrat Cor-Diputació,C Diputació,326.0,7.0,la Dreta de l'Eixample,2.0,Eixample,8009.0,BARCELONA,932656361,"Ensenyament infantil (3-6 anys), Educació prim...",430973.147727,4582969.0,41.395298,2.174295
9,﻿92168166077,Centre Educatiu Sant Francesc d'Assís,Pl Universitat,2.0,10.0,Sant Antoni,2.0,Eixample,8007.0,BARCELONA,934545954,"Ensenyament infantil (3-6 anys), Educació prim...",430055.207879,4581855.0,41.385181,2.163444
11,﻿92168166146,Centre Educatiu Sant Josep,C Montseny,31.0,31.0,la Vila de Gràcia,6.0,Gràcia,8012.0,BARCELONA,932372019,"Ensenyament infantil (0-3 anys), Ensenyament i...",429398.494861,4583769.0,41.402367,2.155367
15,﻿92168166170,Escola Molí de Finestrelles,C Guardiola i Feliu,9.0,60.0,Sant Andreu,9.0,Sant Andreu,8030.0,BARCELONA,933456816,"Ensenyament infantil (3-6 anys), Educació prim...",432294.417917,4587789.0,41.438824,2.189559
17,﻿92168164647,Escola Casas,C Sant Joan de Malta,44.0,65.0,el Clot,10.0,Sant Martí,8018.0,BARCELONA,933004265,"Ensenyament infantil (3-6 anys), Educació prim...",432533.84327,4584418.0,41.408477,2.1928


In [68]:
example_df = schools_reglat_df.drop(columns={'Road Name', 'Street Number', 'ZipCode', 'Town', 'Phone Number', 'geo_epgs_25831_x', 'geo_epgs_25831_y'})
example_df.head(15)

Unnamed: 0,register_id,Name,Neighborhood ID,Neighborhood Name,District ID,District Name,Service Type,Latitude,Longitude
0,﻿92086000496,Facultat d'Informació i Mitjans Audiovisuals - UB,18.0,Sants,3.0,Sants-Montjuïc,Universitats,41.381286,2.138788
1,﻿92086008555,Institut Fort Pius,5.0,el Fort Pienc,2.0,Eixample,Educació secundària,41.394359,2.179807
2,﻿75990047979,Escola Pia de Nostra Senyora,7.0,la Dreta de l'Eixample,2.0,Eixample,"Educació secundària, Formació professional",41.391216,2.167916
4,﻿92168166051,Institut Salvador Seguí,73.0,la Verneda i la Pau,10.0,Sant Martí,Formació professional,41.423094,2.19679
5,﻿92168166070,Escola de Música Kostka,30.0,la Salut,6.0,Gràcia,Música,41.414357,2.15724
6,﻿75990048204,Centre Educatiu Sagrat Cor-Diputació,7.0,la Dreta de l'Eixample,2.0,Eixample,"Ensenyament infantil (3-6 anys), Educació prim...",41.395298,2.174295
9,﻿92168166077,Centre Educatiu Sant Francesc d'Assís,10.0,Sant Antoni,2.0,Eixample,"Ensenyament infantil (3-6 anys), Educació prim...",41.385181,2.163444
11,﻿92168166146,Centre Educatiu Sant Josep,31.0,la Vila de Gràcia,6.0,Gràcia,"Ensenyament infantil (0-3 anys), Ensenyament i...",41.402367,2.155367
15,﻿92168166170,Escola Molí de Finestrelles,60.0,Sant Andreu,9.0,Sant Andreu,"Ensenyament infantil (3-6 anys), Educació prim...",41.438824,2.189559
17,﻿92168164647,Escola Casas,65.0,el Clot,10.0,Sant Martí,"Ensenyament infantil (3-6 anys), Educació prim...",41.408477,2.1928


In [69]:
example_df.to_csv("cleaned_dataset.csv")

#### 2) Non-Regulated Education Institutions


In [70]:
display(schools_no_reglat_df.info())
print("\nSTATISTICS:\n")
#display(schools_no_reglat_df.describe())
non_null_cols, info_df = null_function(schools_no_reglat_df)
print("\nColumns with no null values:", non_null_cols)
print("\nColumns with null values:")
display(info_df)

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 240 entries, 0 to 239
Data columns (total 39 columns):
 #   Column                         Non-Null Count  Dtype  
---  ------                         --------------  -----  
 0   register_id                    240 non-null    object 
 1   name                           240 non-null    object 
 2   institution_id                 15 non-null     float64
 3   institution_name               15 non-null     object 
 4   created                        240 non-null    object 
 5   modified                       240 non-null    object 
 6   addresses_roadtype_id          0 non-null      float64
 7   addresses_roadtype_name        0 non-null      float64
 8   addresses_road_id              240 non-null    int64  
 9   addresses_road_name            240 non-null    object 
 10  addresses_start_street_number  240 non-null    int64  
 11  addresses_end_street_number    27 non-null     float64
 12  addresses_neighborhood_id      240 non-null    int

None


STATISTICS:


Columns with no null values: Index(['register_id', 'name', 'created', 'modified', 'addresses_road_id',
       'addresses_road_name', 'addresses_start_street_number',
       'addresses_neighborhood_id', 'addresses_neighborhood_name',
       'addresses_district_id', 'addresses_district_name',
       'addresses_zip_code', 'addresses_town', 'addresses_main_address',
       'secondary_filters_id', 'secondary_filters_name',
       'secondary_filters_fullpath', 'secondary_filters_tree',
       'secondary_filters_asia_id', 'geo_epgs_25831_x', 'geo_epgs_25831_y',
       'geo_epgs_4326_lat', 'geo_epgs_4326_lon'],
      dtype='object')

Columns with null values:


Unnamed: 0,Column,Null Count,Null Percentage
0,institution_id,225,93.75
1,institution_name,225,93.75
2,addresses_roadtype_id,240,100.0
3,addresses_roadtype_name,240,100.0
4,addresses_end_street_number,213,88.75
5,addresses_type,240,100.0
6,values_id,3,1.25
7,values_attribute_id,3,1.25
8,values_category,3,1.25
9,values_attribute_name,3,1.25


*Seeing the amount of NULL values for each column, we will drop: institution_id, institution_name, addresses_roadtype_id, addresses_roadtype_name, addresses_end_street_number, addresses_type, values_description, estimated_dates, start_date, end_date. Also, the columns created and modified won't be used for the moment.*

In [71]:
# Drop columns with almost all null values
columns_to_drop_schools_no_reglat = ['created', 'modified', 'institution_id', 'institution_name', 'addresses_roadtype_id', 'addresses_roadtype_name' ,
                                  'addresses_end_street_number', 'addresses_type', 'values_description', 'estimated_dates', 'start_date', 'end_date']

schools_no_reglat_df.drop(columns=columns_to_drop_schools_no_reglat, inplace=True)

# Useless: Identifiador Via, Indicador si l'adreça, Valor de l'atribut identificador, Valor de l'atribut, Valors d'atribut Destacat,
# Arbres d'equivalència Identificador, Arbres d'equivalència Ruta, Arbres d'equivalència, Arbres d'equivalència  Id Asia
useless_cols = ['addresses_road_id', 'addresses_main_address', 'values_id', 'values_attribute_id', 'values_outstanding', 'secondary_filters_id',
                'secondary_filters_fullpath', 'secondary_filters_tree', 'secondary_filters_asia_id', 'values_category', 'values_attribute_name']
schools_no_reglat_df.drop(columns=useless_cols, inplace=True)
schools_no_reglat_df.head(10)

Unnamed: 0,register_id,name,addresses_road_name,addresses_start_street_number,addresses_neighborhood_id,addresses_neighborhood_name,addresses_district_id,addresses_district_name,addresses_zip_code,addresses_town,values_value,secondary_filters_name,geo_epgs_25831_x,geo_epgs_25831_y,geo_epgs_4326_lat,geo_epgs_4326_lon
0,﻿92086003810,Institut Alemany de Barcelona - Institut Goethe,C Roger de Flor,224,7,la Dreta de l'Eixample,2,Eixample,8025,BARCELONA,932926006,Idiomes,430638.562851,4583585.0,41.400817,2.170222
1,﻿75990336559,Centre Japonès Amano Juk,C Entença,299,19,les Corts,4,Les Corts,8029,BARCELONA,933218644,Idiomes,427998.665782,4582267.0,41.388716,2.138801
2,﻿75990263527,Escola Accent Idiomes *Puigcerdà,C Puigcerdà,265,73,la Verneda i la Pau,10,Sant Martí,8020,BARCELONA,933052306,Idiomes,433296.270594,4585779.0,41.420804,2.201772
3,﻿75990474858,Escola Meytaqui,C Provença,104,9,la Nova Esquerra de l'Eixample,2,Eixample,8029,BARCELONA,934199502,Informàtica,428832.551764,4581854.0,41.385069,2.148822
4,﻿92086007341,Escola Professional de la Dona,C Sant Pere Més Baix,7,4,"Sant Pere, Santa Caterina i la Ribera",1,Ciutat Vella,8003,BARCELONA,934049106,Idiomes,431090.839773,4582043.0,41.386968,2.175808
5,﻿92086007341,Escola Professional de la Dona,C Sant Pere Més Baix,7,4,"Sant Pere, Santa Caterina i la Ribera",1,Ciutat Vella,8003,BARCELONA,934049106,Informàtica,431090.839773,4582043.0,41.386968,2.175808
6,﻿92086028677,Centre de Formació de Persones Adultes El Clot,C Bilbao,214,65,el Clot,10,Sant Martí,8018,BARCELONA,933075245,Adults,432527.994252,4584791.0,41.411838,2.192689
7,﻿75990065241,Escola d'Idiomes abcCollege,C Guillem Tell,27,27,el Putxet i el Farró,5,Sarrià-Sant Gervasi,8006,BARCELONA,934155757,Idiomes,428846.188223,4583788.0,41.402483,2.148758
8,﻿75990065766,Escola d'Idiomes Wellington House,Carrer de la Selva de Mar,239,72,Sant Martí de Provençals,10,Sant Martí,8020,Barcelona,93 313 2193,Idiomes,432943.997947,4585405.0,41.417402,2.197598
9,﻿99259102144,Escola d'Idiomes,Av Drassanes,3,1,el Raval,1,Ciutat Vella,8001,BARCELONA,934817373,Idiomes,431002.889874,4580843.0,41.376149,2.174892


In [72]:
# Observe New Info
#display(schools_no_reglat_df.info())

# Check if duplicates
has_duplicates(schools_no_reglat_df, 'register_id')

There's duplicate values in column register_id


In [73]:
# Print unique values for characteristics column before merging stuff
print("Unique Characteristics:\n")
print(schools_no_reglat_df['secondary_filters_name'].unique(), "\n")

# Remove weird characteristic (None)

# Aggregate secondary_filters_name (caract.) by register_id and replace column
aggregated_sec_filters = schools_no_reglat_df.groupby('register_id')['secondary_filters_name'].transform(lambda x: ', '.join(x))
schools_no_reglat_df['secondary_filters_name'] = aggregated_sec_filters
#display(schools_no_reglat_df.head(10))

# Drop duplicated register_id
schools_no_reglat_df.drop_duplicates(subset='register_id', inplace=True)
display(schools_no_reglat_df.head(10))

Unique Characteristics:

['Idiomes' 'Informàtica' 'Adults' 'Formació professional'
 'Educació secundària' 'Ensenyament infantil (3-6 anys)'
 'Educació primària'] 



Unnamed: 0,register_id,name,addresses_road_name,addresses_start_street_number,addresses_neighborhood_id,addresses_neighborhood_name,addresses_district_id,addresses_district_name,addresses_zip_code,addresses_town,values_value,secondary_filters_name,geo_epgs_25831_x,geo_epgs_25831_y,geo_epgs_4326_lat,geo_epgs_4326_lon
0,﻿92086003810,Institut Alemany de Barcelona - Institut Goethe,C Roger de Flor,224,7,la Dreta de l'Eixample,2,Eixample,8025,BARCELONA,932926006,Idiomes,430638.562851,4583585.0,41.400817,2.170222
1,﻿75990336559,Centre Japonès Amano Juk,C Entença,299,19,les Corts,4,Les Corts,8029,BARCELONA,933218644,Idiomes,427998.665782,4582267.0,41.388716,2.138801
2,﻿75990263527,Escola Accent Idiomes *Puigcerdà,C Puigcerdà,265,73,la Verneda i la Pau,10,Sant Martí,8020,BARCELONA,933052306,Idiomes,433296.270594,4585779.0,41.420804,2.201772
3,﻿75990474858,Escola Meytaqui,C Provença,104,9,la Nova Esquerra de l'Eixample,2,Eixample,8029,BARCELONA,934199502,Informàtica,428832.551764,4581854.0,41.385069,2.148822
4,﻿92086007341,Escola Professional de la Dona,C Sant Pere Més Baix,7,4,"Sant Pere, Santa Caterina i la Ribera",1,Ciutat Vella,8003,BARCELONA,934049106,"Idiomes, Informàtica",431090.839773,4582043.0,41.386968,2.175808
6,﻿92086028677,Centre de Formació de Persones Adultes El Clot,C Bilbao,214,65,el Clot,10,Sant Martí,8018,BARCELONA,933075245,Adults,432527.994252,4584791.0,41.411838,2.192689
7,﻿75990065241,Escola d'Idiomes abcCollege,C Guillem Tell,27,27,el Putxet i el Farró,5,Sarrià-Sant Gervasi,8006,BARCELONA,934155757,Idiomes,428846.188223,4583788.0,41.402483,2.148758
8,﻿75990065766,Escola d'Idiomes Wellington House,Carrer de la Selva de Mar,239,72,Sant Martí de Provençals,10,Sant Martí,8020,Barcelona,93 313 2193,Idiomes,432943.997947,4585405.0,41.417402,2.197598
9,﻿99259102144,Escola d'Idiomes,Av Drassanes,3,1,el Raval,1,Ciutat Vella,8001,BARCELONA,934817373,Idiomes,431002.889874,4580843.0,41.376149,2.174892
10,﻿92168165158,Centre de Formació de Persones Adultes Freire,Via Favència,254,51,Verdun,8,Nou Barris,8042,BARCELONA,933534419,Adults,431164.30275,4588441.0,41.444597,2.175958


In [74]:
# Rename Columns
schools_no_reglat_df = schools_no_reglat_df.rename(columns={"name": "Name", "addresses_road_name": "Road Name", "addresses_start_street_number": "Street Number",
                                                      "addresses_neighborhood_id": "Neighborhood ID", "addresses_neighborhood_name": "Neighborhood Name",
                                                      "addresses_district_id": "District ID", "addresses_district_name": "District Name",
                                                      "addresses_zip_code": "ZipCode","addresses_town": "Town",
                                                      "values_value": "Phone Number", "secondary_filters_name": "Service Type",
                                                      "geo_epgs_4326_lat": "Latitude", "geo_epgs_4326_lon": "Longitude"})
display(schools_no_reglat_df.head(10))

Unnamed: 0,register_id,Name,Road Name,Street Number,Neighborhood ID,Neighborhood Name,District ID,District Name,ZipCode,Town,Phone Number,Service Type,geo_epgs_25831_x,geo_epgs_25831_y,Latitude,Longitude
0,﻿92086003810,Institut Alemany de Barcelona - Institut Goethe,C Roger de Flor,224,7,la Dreta de l'Eixample,2,Eixample,8025,BARCELONA,932926006,Idiomes,430638.562851,4583585.0,41.400817,2.170222
1,﻿75990336559,Centre Japonès Amano Juk,C Entença,299,19,les Corts,4,Les Corts,8029,BARCELONA,933218644,Idiomes,427998.665782,4582267.0,41.388716,2.138801
2,﻿75990263527,Escola Accent Idiomes *Puigcerdà,C Puigcerdà,265,73,la Verneda i la Pau,10,Sant Martí,8020,BARCELONA,933052306,Idiomes,433296.270594,4585779.0,41.420804,2.201772
3,﻿75990474858,Escola Meytaqui,C Provença,104,9,la Nova Esquerra de l'Eixample,2,Eixample,8029,BARCELONA,934199502,Informàtica,428832.551764,4581854.0,41.385069,2.148822
4,﻿92086007341,Escola Professional de la Dona,C Sant Pere Més Baix,7,4,"Sant Pere, Santa Caterina i la Ribera",1,Ciutat Vella,8003,BARCELONA,934049106,"Idiomes, Informàtica",431090.839773,4582043.0,41.386968,2.175808
6,﻿92086028677,Centre de Formació de Persones Adultes El Clot,C Bilbao,214,65,el Clot,10,Sant Martí,8018,BARCELONA,933075245,Adults,432527.994252,4584791.0,41.411838,2.192689
7,﻿75990065241,Escola d'Idiomes abcCollege,C Guillem Tell,27,27,el Putxet i el Farró,5,Sarrià-Sant Gervasi,8006,BARCELONA,934155757,Idiomes,428846.188223,4583788.0,41.402483,2.148758
8,﻿75990065766,Escola d'Idiomes Wellington House,Carrer de la Selva de Mar,239,72,Sant Martí de Provençals,10,Sant Martí,8020,Barcelona,93 313 2193,Idiomes,432943.997947,4585405.0,41.417402,2.197598
9,﻿99259102144,Escola d'Idiomes,Av Drassanes,3,1,el Raval,1,Ciutat Vella,8001,BARCELONA,934817373,Idiomes,431002.889874,4580843.0,41.376149,2.174892
10,﻿92168165158,Centre de Formació de Persones Adultes Freire,Via Favència,254,51,Verdun,8,Nou Barris,8042,BARCELONA,933534419,Adults,431164.30275,4588441.0,41.444597,2.175958


#### 3) Kindergartens

In [75]:
display(kindergartens_df.info())
print("\nSTATISTICS:\n")
#display(kindergartens_df.describe())
non_null_cols, info_df = null_function(kindergartens_df)
print("\nColumns with no null values:", non_null_cols)
print("\nColumns with null values:")
display(info_df)

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1231 entries, 0 to 1230
Data columns (total 39 columns):
 #   Column                         Non-Null Count  Dtype  
---  ------                         --------------  -----  
 0   register_id                    1231 non-null   object 
 1   name                           1231 non-null   object 
 2   institution_id                 21 non-null     float64
 3   institution_name               21 non-null     object 
 4   created                        1231 non-null   object 
 5   modified                       1231 non-null   object 
 6   addresses_roadtype_id          0 non-null      float64
 7   addresses_roadtype_name        0 non-null      float64
 8   addresses_road_id              1231 non-null   int64  
 9   addresses_road_name            1231 non-null   object 
 10  addresses_start_street_number  1231 non-null   int64  
 11  addresses_end_street_number    53 non-null     float64
 12  addresses_neighborhood_id      1231 non-null   i

None


STATISTICS:


Columns with no null values: Index(['register_id', 'name', 'created', 'modified', 'addresses_road_id',
       'addresses_road_name', 'addresses_start_street_number',
       'addresses_neighborhood_id', 'addresses_neighborhood_name',
       'addresses_district_id', 'addresses_district_name',
       'addresses_zip_code', 'addresses_town', 'addresses_main_address',
       'secondary_filters_id', 'secondary_filters_name',
       'secondary_filters_fullpath', 'secondary_filters_tree',
       'secondary_filters_asia_id', 'geo_epgs_25831_x', 'geo_epgs_25831_y',
       'geo_epgs_4326_lat', 'geo_epgs_4326_lon'],
      dtype='object')

Columns with null values:


Unnamed: 0,Column,Null Count,Null Percentage
0,institution_id,1210,98.29407
1,institution_name,1210,98.29407
2,addresses_roadtype_id,1231,100.0
3,addresses_roadtype_name,1231,100.0
4,addresses_end_street_number,1178,95.694557
5,addresses_type,1231,100.0
6,values_id,8,0.649878
7,values_attribute_id,8,0.649878
8,values_category,8,0.649878
9,values_attribute_name,8,0.649878


*Seeing the amount of NULL values for each column, we will drop: institution_id, institution_name, addresses_roadtype_id, addresses_roadtype_name, addresses_end_street_number, addresses_type, values_description, estimated_dates, start_date, end_date. Also, the columns created and modified won't be used for the moment.*

In [76]:
# Drop columns with almost all null values
columns_to_drop_kindergarten = ['created', 'modified', 'institution_id', 'institution_name', 'addresses_roadtype_id', 'addresses_roadtype_name' ,
                                  'addresses_end_street_number', 'addresses_type', 'values_description', 'estimated_dates', 'start_date', 'end_date']

kindergartens_df.drop(columns=columns_to_drop_kindergarten, inplace=True)

# Useless: Identifiador Via, Indicador si l'adreça, Valor de l'atribut identificador, Valor de l'atribut, Valors d'atribut Destacat,
# Arbres d'equivalència Identificador, Arbres d'equivalència Ruta, Arbres d'equivalència, Arbres d'equivalència  Id Asia
useless_cols = ['addresses_road_id', 'addresses_main_address', 'values_id', 'values_attribute_id', 'values_outstanding', 'secondary_filters_id',
                'secondary_filters_fullpath', 'secondary_filters_tree', 'secondary_filters_asia_id', 'values_category', 'values_attribute_name']
kindergartens_df.drop(columns=useless_cols, inplace=True)
kindergartens_df.head(10)

Unnamed: 0,register_id,name,addresses_road_name,addresses_start_street_number,addresses_neighborhood_id,addresses_neighborhood_name,addresses_district_id,addresses_district_name,addresses_zip_code,addresses_town,values_value,secondary_filters_name,geo_epgs_25831_x,geo_epgs_25831_y,geo_epgs_4326_lat,geo_epgs_4326_lon
0,﻿75990048204,Centre Educatiu Sagrat Cor-Diputació,C Diputació,326,7,la Dreta de l'Eixample,2,Eixample,8009,BARCELONA,932656361,Ensenyament infantil (3-6 anys),430973.147727,4582969.0,41.395298,2.174295
1,﻿75990048204,Centre Educatiu Sagrat Cor-Diputació,C Diputació,326,7,la Dreta de l'Eixample,2,Eixample,8009,BARCELONA,932656361,Educació primària,430973.147727,4582969.0,41.395298,2.174295
2,﻿75990048204,Centre Educatiu Sagrat Cor-Diputació,C Diputació,326,7,la Dreta de l'Eixample,2,Eixample,8009,BARCELONA,932656361,Educació secundària,430973.147727,4582969.0,41.395298,2.174295
3,﻿92168166077,Centre Educatiu Sant Francesc d'Assís,Pl Universitat,2,10,Sant Antoni,2,Eixample,8007,BARCELONA,934545954,Ensenyament infantil (3-6 anys),430055.207879,4581855.0,41.385181,2.163444
4,﻿92168166077,Centre Educatiu Sant Francesc d'Assís,Pl Universitat,2,10,Sant Antoni,2,Eixample,8007,BARCELONA,934545954,Educació primària,430055.207879,4581855.0,41.385181,2.163444
5,﻿92168166146,Centre Educatiu Sant Josep,C Montseny,31,31,la Vila de Gràcia,6,Gràcia,8012,BARCELONA,932372019,Ensenyament infantil (0-3 anys),429398.494861,4583769.0,41.402367,2.155367
6,﻿92168166146,Centre Educatiu Sant Josep,C Montseny,31,31,la Vila de Gràcia,6,Gràcia,8012,BARCELONA,932372019,Ensenyament infantil (3-6 anys),429398.494861,4583769.0,41.402367,2.155367
7,﻿92168166146,Centre Educatiu Sant Josep,C Montseny,31,31,la Vila de Gràcia,6,Gràcia,8012,BARCELONA,932372019,Educació primària,429398.494861,4583769.0,41.402367,2.155367
8,﻿92168166146,Centre Educatiu Sant Josep,C Montseny,31,31,la Vila de Gràcia,6,Gràcia,8012,BARCELONA,932372019,Educació secundària,429398.494861,4583769.0,41.402367,2.155367
9,﻿92168166170,Escola Molí de Finestrelles,C Guardiola i Feliu,9,60,Sant Andreu,9,Sant Andreu,8030,BARCELONA,933456816,Ensenyament infantil (3-6 anys),432294.417917,4587789.0,41.438824,2.189559


In [77]:
# Observe New Info
#display(kindergartens_df.info())

# Check if duplicates
has_duplicates(kindergartens_df, 'register_id')

There's duplicate values in column register_id


In [78]:
# Print unique values for characteristics column before merging stuff
print("Unique Characteristics:\n")
print(kindergartens_df['secondary_filters_name'].unique(), "\n")

# Remove weird characteristic (None)

# Aggregate secondary_filters_name (caract.) by register_id and replace column
aggregated_sec_filters = kindergartens_df.groupby('register_id')['secondary_filters_name'].transform(lambda x: ', '.join(x))
kindergartens_df['secondary_filters_name'] = aggregated_sec_filters
#display(kindergartens_df.head(10))

# Drop duplicated register_id
kindergartens_df.drop_duplicates(subset='register_id', inplace=True)
display(kindergartens_df.head(10))

Unique Characteristics:

['Ensenyament infantil (3-6 anys)' 'Educació primària'
 'Educació secundària' 'Ensenyament infantil (0-3 anys)'
 'Escoles Bressol municipals' 'Formació professional' 'Adults'] 



Unnamed: 0,register_id,name,addresses_road_name,addresses_start_street_number,addresses_neighborhood_id,addresses_neighborhood_name,addresses_district_id,addresses_district_name,addresses_zip_code,addresses_town,values_value,secondary_filters_name,geo_epgs_25831_x,geo_epgs_25831_y,geo_epgs_4326_lat,geo_epgs_4326_lon
0,﻿75990048204,Centre Educatiu Sagrat Cor-Diputació,C Diputació,326,7,la Dreta de l'Eixample,2,Eixample,8009,BARCELONA,932656361,"Ensenyament infantil (3-6 anys), Educació prim...",430973.147727,4582969.0,41.395298,2.174295
3,﻿92168166077,Centre Educatiu Sant Francesc d'Assís,Pl Universitat,2,10,Sant Antoni,2,Eixample,8007,BARCELONA,934545954,"Ensenyament infantil (3-6 anys), Educació prim...",430055.207879,4581855.0,41.385181,2.163444
5,﻿92168166146,Centre Educatiu Sant Josep,C Montseny,31,31,la Vila de Gràcia,6,Gràcia,8012,BARCELONA,932372019,"Ensenyament infantil (0-3 anys), Ensenyament i...",429398.494861,4583769.0,41.402367,2.155367
9,﻿92168166170,Escola Molí de Finestrelles,C Guardiola i Feliu,9,60,Sant Andreu,9,Sant Andreu,8030,BARCELONA,933456816,"Ensenyament infantil (3-6 anys), Educació prim...",432294.417917,4587789.0,41.438824,2.189559
11,﻿92168164647,Escola Casas,C Sant Joan de Malta,44,65,el Clot,10,Sant Martí,8018,BARCELONA,933004265,"Ensenyament infantil (3-6 anys), Educació prim...",432533.84327,4584418.0,41.408477,2.1928
13,﻿92168164659,Escola Catalònia,C Perú,195,71,Provençals del Poblenou,10,Sant Martí,8020,BARCELONA,933076366,"Ensenyament infantil (3-6 anys), Educació prim...",433255.111168,4584900.0,41.412883,2.201376
15,﻿92168166196,Centre Educatiu Santa Teresa - Ganduxer,C Ganduxer,85,24,les Tres Torres,5,Sarrià-Sant Gervasi,8022,BARCELONA,932123354,"Ensenyament infantil (3-6 anys), Educació prim...",427574.497635,4583521.0,41.39997,2.133578
18,﻿92168164771,Escola Collaso i Gil,C Sant Pau,101,1,el Raval,1,Ciutat Vella,8001,BARCELONA,934410098,"Ensenyament infantil (3-6 anys), Educació prim...",430508.294681,4580855.0,41.376217,2.168977
20,﻿92168164884,Escola del Mar,C Gènova,12,35,el Guinardó,7,Horta-Guinardó,8041,BARCELONA,934364751,"Ensenyament infantil (3-6 anys), Educació prim...",430651.08234,4585477.0,41.41786,2.170155
22,﻿92168164900,Escola Diputació,C Diputació,112,9,la Nova Esquerra de l'Eixample,2,Eixample,8015,BARCELONA,934546868,"Ensenyament infantil (3-6 anys), Educació prim...",429426.724073,4581452.0,41.381502,2.155975


In [79]:
# Rename Columns
kindergartens_df = kindergartens_df.rename(columns={"name": "Name", "addresses_road_name": "Road Name", "addresses_start_street_number": "Street Number",
                                                      "addresses_neighborhood_id": "Neighborhood ID", "addresses_neighborhood_name": "Neighborhood Name",
                                                      "addresses_district_id": "District ID", "addresses_district_name": "District Name",
                                                      "addresses_zip_code": "ZipCode","addresses_town": "Town",
                                                      "values_value": "Phone Number", "secondary_filters_name": "Service Type",
                                                    "geo_epgs_4326_lat": "Latitude", "geo_epgs_4326_lon": "Longitude"})
display(kindergartens_df.head(10))

Unnamed: 0,register_id,Name,Road Name,Street Number,Neighborhood ID,Neighborhood Name,District ID,District Name,ZipCode,Town,Phone Number,Service Type,geo_epgs_25831_x,geo_epgs_25831_y,Latitude,Longitude
0,﻿75990048204,Centre Educatiu Sagrat Cor-Diputació,C Diputació,326,7,la Dreta de l'Eixample,2,Eixample,8009,BARCELONA,932656361,"Ensenyament infantil (3-6 anys), Educació prim...",430973.147727,4582969.0,41.395298,2.174295
3,﻿92168166077,Centre Educatiu Sant Francesc d'Assís,Pl Universitat,2,10,Sant Antoni,2,Eixample,8007,BARCELONA,934545954,"Ensenyament infantil (3-6 anys), Educació prim...",430055.207879,4581855.0,41.385181,2.163444
5,﻿92168166146,Centre Educatiu Sant Josep,C Montseny,31,31,la Vila de Gràcia,6,Gràcia,8012,BARCELONA,932372019,"Ensenyament infantil (0-3 anys), Ensenyament i...",429398.494861,4583769.0,41.402367,2.155367
9,﻿92168166170,Escola Molí de Finestrelles,C Guardiola i Feliu,9,60,Sant Andreu,9,Sant Andreu,8030,BARCELONA,933456816,"Ensenyament infantil (3-6 anys), Educació prim...",432294.417917,4587789.0,41.438824,2.189559
11,﻿92168164647,Escola Casas,C Sant Joan de Malta,44,65,el Clot,10,Sant Martí,8018,BARCELONA,933004265,"Ensenyament infantil (3-6 anys), Educació prim...",432533.84327,4584418.0,41.408477,2.1928
13,﻿92168164659,Escola Catalònia,C Perú,195,71,Provençals del Poblenou,10,Sant Martí,8020,BARCELONA,933076366,"Ensenyament infantil (3-6 anys), Educació prim...",433255.111168,4584900.0,41.412883,2.201376
15,﻿92168166196,Centre Educatiu Santa Teresa - Ganduxer,C Ganduxer,85,24,les Tres Torres,5,Sarrià-Sant Gervasi,8022,BARCELONA,932123354,"Ensenyament infantil (3-6 anys), Educació prim...",427574.497635,4583521.0,41.39997,2.133578
18,﻿92168164771,Escola Collaso i Gil,C Sant Pau,101,1,el Raval,1,Ciutat Vella,8001,BARCELONA,934410098,"Ensenyament infantil (3-6 anys), Educació prim...",430508.294681,4580855.0,41.376217,2.168977
20,﻿92168164884,Escola del Mar,C Gènova,12,35,el Guinardó,7,Horta-Guinardó,8041,BARCELONA,934364751,"Ensenyament infantil (3-6 anys), Educació prim...",430651.08234,4585477.0,41.41786,2.170155
22,﻿92168164900,Escola Diputació,C Diputació,112,9,la Nova Esquerra de l'Eixample,2,Eixample,8015,BARCELONA,934546868,"Ensenyament infantil (3-6 anys), Educació prim...",429426.724073,4581452.0,41.381502,2.155975


#### 4) Libraries

In [80]:
display(libraries_df.info())
print("\nSTATISTICS:\n")
#display(libraries_df.describe())
non_null_cols, info_df = null_function(libraries_df)
print("\nColumns with no null values:", non_null_cols)
print("\nColumns with null values:")
display(info_df)

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 400 entries, 0 to 399
Data columns (total 16 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   Any               400 non-null    int64  
 1   Indicador         400 non-null    object 
 2   Nom_Equipament    400 non-null    object 
 3   Valor             400 non-null    int64  
 4   Notes_Dades       0 non-null      float64
 5   Notes_Equipament  20 non-null     object 
 6   Codi_Districte    400 non-null    int64  
 7   Nom_Districte     400 non-null    object 
 8   Codi_Barri        400 non-null    int64  
 9   Nom_Barri         400 non-null    object 
 10  Titularitat       400 non-null    object 
 11  Tipus_Us          400 non-null    object 
 12  Tipus_Equipament  400 non-null    object 
 13  Ambit             400 non-null    object 
 14  Latitud           400 non-null    float64
 15  Longitud          400 non-null    float64
dtypes: float64(3), int64(4), object(9)
memory us

None


STATISTICS:


Columns with no null values: Index(['Any', 'Indicador', 'Nom_Equipament', 'Valor', 'Codi_Districte',
       'Nom_Districte', 'Codi_Barri', 'Nom_Barri', 'Titularitat', 'Tipus_Us',
       'Tipus_Equipament', 'Ambit', 'Latitud', 'Longitud'],
      dtype='object')

Columns with null values:


Unnamed: 0,Column,Null Count,Null Percentage
0,Notes_Dades,400,100.0
1,Notes_Equipament,380,95.0


*Seeing the amount of NULL values for each column, we will drop: Notes_Dades, Notes_Equipament.*

In [81]:
# Drop columns with almost all null values
columns_to_drop_libraries = ['Notes_Dades', 'Notes_Equipament']

libraries_df.drop(columns=columns_to_drop_libraries, inplace=True)
libraries_df.head(10)

Unnamed: 0,Any,Indicador,Nom_Equipament,Valor,Codi_Districte,Nom_Districte,Codi_Barri,Nom_Barri,Titularitat,Tipus_Us,Tipus_Equipament,Ambit,Latitud,Longitud
0,2022,Assistents_Activitats,Biblioteca Barceloneta - La Fraternitat,335,1,Ciutat Vella,3,la Barceloneta,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.379201,2.188854
1,2022,Assistents_Activitats,Biblioteca Francesca Bonnemaison,2191,1,Ciutat Vella,4,"Sant Pere, Santa Caterina i la Ribera",Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.386937,2.17579
2,2022,Assistents_Activitats,Biblioteca Gòtic - Andreu Nin,1352,1,Ciutat Vella,2,el Barri Gòtic,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.37873,2.175979
3,2022,Assistents_Activitats,Biblioteca Sant Pau - Santa Creu,645,1,Ciutat Vella,1,el Raval,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.381057,2.169794
4,2022,Assistents_Activitats,Biblioteca Esquerra de l'Eixample - Agustí Cen...,4283,2,Eixample,9,la Nova Esquerra de l'Eixample,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.386449,2.15279
5,2022,Assistents_Activitats,Biblioteca Fort Pienc,822,2,Eixample,5,el Fort Pienc,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.395555,2.182448
6,2022,Assistents_Activitats,Biblioteca Joan Miró,692,2,Eixample,9,la Nova Esquerra de l'Eixample,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.378817,2.14923
7,2022,Assistents_Activitats,Biblioteca Sagrada Família - J. M. Ainaud de L...,931,2,Eixample,6,la Sagrada Família,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.405577,2.176118
8,2022,Assistents_Activitats,Biblioteca Sant Antoni - Joan Oliver,950,2,Eixample,10,Sant Antoni,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.377385,2.162778
9,2022,Assistents_Activitats,Biblioteca Sofia Barat,718,2,Eixample,7,la Dreta de l'Eixample,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.394674,2.171504


In [82]:
# Observe New Info
#display(libraries_df.info())

# Check if duplicates
has_duplicates(libraries_df, 'Nom_Equipament')

There's duplicate values in column Nom_Equipament


In [83]:
# Print unique values for characteristics column before merging stuff
print("Unique Characteristics:\n")
print(libraries_df['Tipus_Equipament'].unique(), "\n")

# Remove weird characteristic (None)

# Drop duplicated register_id
libraries_df.drop_duplicates(subset='Nom_Equipament', inplace=True)
display(libraries_df.head(10))

Unique Characteristics:

['Biblioteques de Barcelona'] 



Unnamed: 0,Any,Indicador,Nom_Equipament,Valor,Codi_Districte,Nom_Districte,Codi_Barri,Nom_Barri,Titularitat,Tipus_Us,Tipus_Equipament,Ambit,Latitud,Longitud
0,2022,Assistents_Activitats,Biblioteca Barceloneta - La Fraternitat,335,1,Ciutat Vella,3,la Barceloneta,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.379201,2.188854
1,2022,Assistents_Activitats,Biblioteca Francesca Bonnemaison,2191,1,Ciutat Vella,4,"Sant Pere, Santa Caterina i la Ribera",Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.386937,2.17579
2,2022,Assistents_Activitats,Biblioteca Gòtic - Andreu Nin,1352,1,Ciutat Vella,2,el Barri Gòtic,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.37873,2.175979
3,2022,Assistents_Activitats,Biblioteca Sant Pau - Santa Creu,645,1,Ciutat Vella,1,el Raval,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.381057,2.169794
4,2022,Assistents_Activitats,Biblioteca Esquerra de l'Eixample - Agustí Cen...,4283,2,Eixample,9,la Nova Esquerra de l'Eixample,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.386449,2.15279
5,2022,Assistents_Activitats,Biblioteca Fort Pienc,822,2,Eixample,5,el Fort Pienc,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.395555,2.182448
6,2022,Assistents_Activitats,Biblioteca Joan Miró,692,2,Eixample,9,la Nova Esquerra de l'Eixample,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.378817,2.14923
7,2022,Assistents_Activitats,Biblioteca Sagrada Família - J. M. Ainaud de L...,931,2,Eixample,6,la Sagrada Família,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.405577,2.176118
8,2022,Assistents_Activitats,Biblioteca Sant Antoni - Joan Oliver,950,2,Eixample,10,Sant Antoni,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.377385,2.162778
9,2022,Assistents_Activitats,Biblioteca Sofia Barat,718,2,Eixample,7,la Dreta de l'Eixample,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.394674,2.171504


In [84]:
# Rename Columns
libraries_df = libraries_df.rename(columns={"Any": "Year", "Indicador": "Indicator", "Nom_Equipament": "Name", "Valor": "Id",
                                            "Codi_Districte": "District ID", "Nom_Districte": "District Name", "Codi_Barri": "Neighborhood ID",
                                            "Nom_Barri": "Neighborhood Name", "Titularitat": "Ownership", "Tipus_Us": "Use",
                                            "Tipus_Equipament": "Service Type", "Ambit": "Scope", "Latitud": "Latitude", "Longitud": "Longitude"})
display(libraries_df.head(10))

Unnamed: 0,Year,Indicator,Name,Id,District ID,District Name,Neighborhood ID,Neighborhood Name,Ownership,Use,Service Type,Scope,Latitude,Longitude
0,2022,Assistents_Activitats,Biblioteca Barceloneta - La Fraternitat,335,1,Ciutat Vella,3,la Barceloneta,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.379201,2.188854
1,2022,Assistents_Activitats,Biblioteca Francesca Bonnemaison,2191,1,Ciutat Vella,4,"Sant Pere, Santa Caterina i la Ribera",Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.386937,2.17579
2,2022,Assistents_Activitats,Biblioteca Gòtic - Andreu Nin,1352,1,Ciutat Vella,2,el Barri Gòtic,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.37873,2.175979
3,2022,Assistents_Activitats,Biblioteca Sant Pau - Santa Creu,645,1,Ciutat Vella,1,el Raval,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.381057,2.169794
4,2022,Assistents_Activitats,Biblioteca Esquerra de l'Eixample - Agustí Cen...,4283,2,Eixample,9,la Nova Esquerra de l'Eixample,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.386449,2.15279
5,2022,Assistents_Activitats,Biblioteca Fort Pienc,822,2,Eixample,5,el Fort Pienc,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.395555,2.182448
6,2022,Assistents_Activitats,Biblioteca Joan Miró,692,2,Eixample,9,la Nova Esquerra de l'Eixample,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.378817,2.14923
7,2022,Assistents_Activitats,Biblioteca Sagrada Família - J. M. Ainaud de L...,931,2,Eixample,6,la Sagrada Família,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.405577,2.176118
8,2022,Assistents_Activitats,Biblioteca Sant Antoni - Joan Oliver,950,2,Eixample,10,Sant Antoni,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.377385,2.162778
9,2022,Assistents_Activitats,Biblioteca Sofia Barat,718,2,Eixample,7,la Dreta de l'Eixample,Ajuntament de Barcelona,Biblioteques de Barcelona,Biblioteques de Barcelona,Lletres,41.394674,2.171504


#### 5) Libraries and Study Rooms

In [85]:
display(libraries_studroom_df.info())
print("\nSTATISTICS:\n")
#display(libraries_studroom_df.describe())
non_null_cols, info_df = null_function(libraries_studroom_df)
print("\nColumns with no null values:", non_null_cols)
print("\nColumns with null values:")
display(info_df)

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 444 entries, 0 to 443
Data columns (total 39 columns):
 #   Column                         Non-Null Count  Dtype  
---  ------                         --------------  -----  
 0   register_id                    444 non-null    object 
 1   name                           444 non-null    object 
 2   institution_id                 208 non-null    float64
 3   institution_name               208 non-null    object 
 4   created                        444 non-null    object 
 5   modified                       444 non-null    object 
 6   addresses_roadtype_id          0 non-null      float64
 7   addresses_roadtype_name        0 non-null      float64
 8   addresses_road_id              441 non-null    float64
 9   addresses_road_name            441 non-null    object 
 10  addresses_start_street_number  438 non-null    float64
 11  addresses_end_street_number    24 non-null     float64
 12  addresses_neighborhood_id      441 non-null    flo

None


STATISTICS:


Columns with no null values: Index(['register_id', 'name', 'created', 'modified', 'addresses_town',
       'addresses_main_address', 'secondary_filters_id',
       'secondary_filters_name', 'secondary_filters_fullpath',
       'secondary_filters_tree', 'secondary_filters_asia_id',
       'geo_epgs_25831_x', 'geo_epgs_25831_y', 'geo_epgs_4326_lat',
       'geo_epgs_4326_lon'],
      dtype='object')

Columns with null values:


Unnamed: 0,Column,Null Count,Null Percentage
0,institution_id,236,53.153153
1,institution_name,236,53.153153
2,addresses_roadtype_id,444,100.0
3,addresses_roadtype_name,444,100.0
4,addresses_road_id,3,0.675676
5,addresses_road_name,3,0.675676
6,addresses_start_street_number,6,1.351351
7,addresses_end_street_number,420,94.594595
8,addresses_neighborhood_id,3,0.675676
9,addresses_neighborhood_name,3,0.675676


*Seeing the amount of NULL values for each column, we will drop: addresses_roadtype_id, addresses_roadtype_name, addresses_end_street_number, addresses_type, values_description, estimated_dates, start_date, end_date. Also, the columns created and modified won't be used for the moment.*

In [86]:
# Drop columns with almost all null values
columns_to_drop_libraries_studroom = ['created', 'modified', 'addresses_roadtype_id', 'addresses_roadtype_name' ,
                                  'addresses_end_street_number', 'addresses_type', 'values_description', 'estimated_dates', 'start_date', 'end_date']

libraries_studroom_df.drop(columns=columns_to_drop_libraries_studroom, inplace=True)

# Useless: Identifiador Via, Indicador si l'adreça, Valor de l'atribut identificador, Valor de l'atribut, Valors d'atribut Destacat,
# Arbres d'equivalència Identificador, Arbres d'equivalència Ruta, Arbres d'equivalència, Arbres d'equivalència  Id Asia
useless_cols = ['addresses_road_id', 'addresses_main_address', 'values_id', 'values_attribute_id', 'values_outstanding', 'secondary_filters_id',
                'secondary_filters_fullpath', 'secondary_filters_tree', 'secondary_filters_asia_id', 'values_category', 'values_attribute_name']
libraries_studroom_df.drop(columns=useless_cols, inplace=True)
libraries_studroom_df.head(10)

Unnamed: 0,register_id,name,institution_id,institution_name,addresses_road_name,addresses_start_street_number,addresses_neighborhood_id,addresses_neighborhood_name,addresses_district_id,addresses_district_name,addresses_zip_code,addresses_town,values_value,secondary_filters_name,geo_epgs_25831_x,geo_epgs_25831_y,geo_epgs_4326_lat,geo_epgs_4326_lon
0,﻿92086000497,CRAI Biblioteca d'Informació i Mitjans Audiovi...,92086000000.0,Facultat d'Informació i Mitjans Audiovisuals - UB,Melcior de Palau,140.0,18.0,Sants,3.0,Sants-Montjuïc,8014.0,BARCELONA,934035769,Biblioteques,427989.387049,4581443.0,41.381286,2.138788
1,﻿92086000497,CRAI Biblioteca d'Informació i Mitjans Audiovi...,92086000000.0,Facultat d'Informació i Mitjans Audiovisuals - UB,Melcior de Palau,140.0,18.0,Sants,3.0,Sants-Montjuïc,8014.0,BARCELONA,934035769,Sales d'estudi,427989.387049,4581443.0,41.381286,2.138788
2,﻿92086000548,Arxiu Bibliogràfic Excursionista,92086000000.0,Unió Excursionista de Catalunya de Barcelona,C Rocafort,7.0,10.0,Sant Antoni,2.0,Eixample,8015.0,BARCELONA,934545855,Biblioteques,429596.755557,4580794.0,41.375585,2.158085
3,﻿92086008608,Arxiu Històric de la Ciutat de Barcelona,,,C Santa Llúcia,1.0,2.0,el Barri Gòtic,1.0,Ciutat Vella,8002.0,BARCELONA,932562255,Arxius municipals,431094.438799,4581745.0,41.384285,2.175885
4,﻿92086008608,Arxiu Històric de la Ciutat de Barcelona,,,C Santa Llúcia,1.0,2.0,el Barri Gòtic,1.0,Ciutat Vella,8002.0,BARCELONA,932562255,WiFi BCN,431094.438799,4581745.0,41.384285,2.175885
5,﻿92086029955,Museu,93343140000.0,Col·legi Oficial d'Odontòlegs i Estomatòlegs d...,Trav Gràcia,93.0,26.0,Sant Gervasi - Galvany,5.0,Sarrià-Sant Gervasi,8006.0,BARCELONA,933101555,Museus,429132.135551,4583283.0,41.397965,2.152238
6,﻿1242142943,Biblioteca Poble-sec - Francesc Boix,,,Carrer de Blai,34.0,11.0,el Poble-sec,3.0,Sants-Montjuïc,8004.0,Barcelona,934430105,Biblioteques,430093.269768,4580608.0,41.373953,2.164043
7,﻿1242142943,Biblioteca Poble-sec - Francesc Boix,,,Carrer de Blai,34.0,11.0,el Poble-sec,3.0,Sants-Montjuïc,8004.0,Barcelona,934430105,Biblioteques municipals,430093.269768,4580608.0,41.373953,2.164043
8,﻿1242142943,Biblioteca Poble-sec - Francesc Boix,,,Carrer de Blai,34.0,11.0,el Poble-sec,3.0,Sants-Montjuïc,8004.0,Barcelona,934430105,Sales d'estudi,430093.269768,4580608.0,41.373953,2.164043
9,﻿62172134,Biblioteca Josep Benet,96025140000.0,Museu d'Història de Catalunya,Pl Pau Vila,3.0,3.0,la Barceloneta,1.0,Ciutat Vella,8039.0,BARCELONA,932254700,Biblioteques,431896.431084,4581340.0,41.3807,2.185521


In [87]:
# Observe New Info
#display(libraries_studroom_df.info())

# Check if duplicates
has_duplicates(libraries_studroom_df, 'register_id')

There's duplicate values in column register_id


In [88]:
# Print unique values for characteristics column before merging stuff
print("Unique Characteristics:\n")
print(libraries_studroom_df['secondary_filters_name'].unique(), "\n")


# Remove weird characteristic (WiFi BCN, Museus, Museus municipals, Arxius municipals, Parcs i jardins)
libraries_studroom_df = libraries_studroom_df[libraries_studroom_df['secondary_filters_name'] != 'WiFi BCN']
libraries_studroom_df = libraries_studroom_df[libraries_studroom_df['secondary_filters_name'] != 'Museus']
libraries_studroom_df = libraries_studroom_df[libraries_studroom_df['secondary_filters_name'] != 'Museus municipals']
libraries_studroom_df = libraries_studroom_df[libraries_studroom_df['secondary_filters_name'] != 'Arxius municipals']
libraries_studroom_df = libraries_studroom_df[libraries_studroom_df['secondary_filters_name'] != 'Parcs i jardins']
libraries_studroom_df = libraries_studroom_df[libraries_studroom_df['secondary_filters_name'] != 'Instal·lacions esportives']
libraries_studroom_df = libraries_studroom_df[libraries_studroom_df['secondary_filters_name'] != 'Natació']
libraries_studroom_df = libraries_studroom_df[libraries_studroom_df['secondary_filters_name'] != 'Altres esports']

# Aggregate secondary_filters_name (caract.) by register_id and replace column
aggregated_sec_filters = libraries_studroom_df.groupby('register_id')['secondary_filters_name'].transform(lambda x: ', '.join(x))
libraries_studroom_df['secondary_filters_name'] = aggregated_sec_filters
#display(libraries_studroom_df.head(10))

# Drop duplicated register_id
libraries_studroom_df.drop_duplicates(subset='register_id', inplace=True)
display(libraries_studroom_df.head(10))

Unique Characteristics:

['Biblioteques' "Sales d'estudi" 'Arxius municipals' 'WiFi BCN' 'Museus'
 'Biblioteques municipals' 'Museus municipals' 'Parcs i jardins'
 'Universitats' 'Altres esports' 'Natació' 'Instal·lacions esportives'] 



Unnamed: 0,register_id,name,institution_id,institution_name,addresses_road_name,addresses_start_street_number,addresses_neighborhood_id,addresses_neighborhood_name,addresses_district_id,addresses_district_name,addresses_zip_code,addresses_town,values_value,secondary_filters_name,geo_epgs_25831_x,geo_epgs_25831_y,geo_epgs_4326_lat,geo_epgs_4326_lon
0,﻿92086000497,CRAI Biblioteca d'Informació i Mitjans Audiovi...,92086000000.0,Facultat d'Informació i Mitjans Audiovisuals - UB,Melcior de Palau,140.0,18.0,Sants,3.0,Sants-Montjuïc,8014.0,BARCELONA,934035769,"Biblioteques, Sales d'estudi",427989.387049,4581443.0,41.381286,2.138788
2,﻿92086000548,Arxiu Bibliogràfic Excursionista,92086000000.0,Unió Excursionista de Catalunya de Barcelona,C Rocafort,7.0,10.0,Sant Antoni,2.0,Eixample,8015.0,BARCELONA,934545855,Biblioteques,429596.755557,4580794.0,41.375585,2.158085
6,﻿1242142943,Biblioteca Poble-sec - Francesc Boix,,,Carrer de Blai,34.0,11.0,el Poble-sec,3.0,Sants-Montjuïc,8004.0,Barcelona,934430105,"Biblioteques, Biblioteques municipals, Sales d...",430093.269768,4580608.0,41.373953,2.164043
9,﻿62172134,Biblioteca Josep Benet,96025140000.0,Museu d'Història de Catalunya,Pl Pau Vila,3.0,3.0,la Barceloneta,1.0,Ciutat Vella,8039.0,BARCELONA,932254700,Biblioteques,431896.431084,4581340.0,41.3807,2.185521
10,﻿93314142035,Biblioteca,92086020000.0,Agrupació Astronòmica Barcelona,C Viladomat,291.0,9.0,la Nova Esquerra de l'Eixample,2.0,Eixample,8029.0,BARCELONA,934514488,Biblioteques,428562.742307,4582231.0,41.388441,2.145551
12,﻿94166142341,CRAI - Biblioteca de Grau,92086000000.0,Facultat d'Economia i Empresa - UB,C John M. Keynes,1.0,21.0,Pedralbes,4.0,Les Corts,8034.0,BARCELONA,934021602,"Biblioteques, Sales d'estudi",426094.38333,4582094.0,41.386977,2.116048
14,﻿98030094836,Biblioteca,96248120000.0,Espeleo Club Gràcia,C Astúries,83.0,31.0,la Vila de Gràcia,6.0,Gràcia,8024.0,BARCELONA,934150460,Biblioteques,429489.334924,4584031.0,41.404734,2.156423
15,﻿97044191228,Biblioteca,75990150000.0,Fundació Pere Tarrés,C Santaló,37.0,26.0,Sant Gervasi - Galvany,5.0,Sarrià-Sant Gervasi,8021.0,BARCELONA,934152551,Biblioteques,428588.720886,4583025.0,41.395591,2.145768
16,﻿97063160238,Centre de Documentació Begoña Raventós -Biblio...,75990130000.0,Fundació Catalana de Síndrome de Down,C Comte Borrell,201.0,9.0,la Nova Esquerra de l'Eixample,2.0,Eixample,8029.0,BARCELONA,932151988,Biblioteques,429116.016012,4581840.0,41.384961,2.152214
18,﻿99103090600,Biblioteca - Centre d'Investigació i Desenvolu...,92086000000.0,Consell Superior d'Investigacions Científiques,C Jordi Girona,18.0,21.0,Pedralbes,4.0,Les Corts,8034.0,BARCELONA,934006100,Biblioteques,426003.0322,4582176.0,41.387707,2.114945


In [89]:
# Rename Columns
libraries_studroom_df = libraries_studroom_df.rename(columns={"name": "Name", "addresses_road_name": "Road Name", "addresses_start_street_number": "Street Number",
                                                              "addresses_neighborhood_id": "Neighborhood ID", "addresses_neighborhood_name": "Neighborhood Name",
                                                              "addresses_district_id": "District ID", "addresses_district_name": "District Name",
                                                              "addresses_zip_code": "ZipCode","addresses_town": "Town",
                                                              "values_value": "Phone Number", "secondary_filters_name": "Service Type",
                                                              "geo_epgs_4326_lat": "Latitude", "geo_epgs_4326_lon": "Longitude"})
display(libraries_studroom_df.head(10))

Unnamed: 0,register_id,Name,institution_id,institution_name,Road Name,Street Number,Neighborhood ID,Neighborhood Name,District ID,District Name,ZipCode,Town,Phone Number,Service Type,geo_epgs_25831_x,geo_epgs_25831_y,Latitude,Longitude
0,﻿92086000497,CRAI Biblioteca d'Informació i Mitjans Audiovi...,92086000000.0,Facultat d'Informació i Mitjans Audiovisuals - UB,Melcior de Palau,140.0,18.0,Sants,3.0,Sants-Montjuïc,8014.0,BARCELONA,934035769,"Biblioteques, Sales d'estudi",427989.387049,4581443.0,41.381286,2.138788
2,﻿92086000548,Arxiu Bibliogràfic Excursionista,92086000000.0,Unió Excursionista de Catalunya de Barcelona,C Rocafort,7.0,10.0,Sant Antoni,2.0,Eixample,8015.0,BARCELONA,934545855,Biblioteques,429596.755557,4580794.0,41.375585,2.158085
6,﻿1242142943,Biblioteca Poble-sec - Francesc Boix,,,Carrer de Blai,34.0,11.0,el Poble-sec,3.0,Sants-Montjuïc,8004.0,Barcelona,934430105,"Biblioteques, Biblioteques municipals, Sales d...",430093.269768,4580608.0,41.373953,2.164043
9,﻿62172134,Biblioteca Josep Benet,96025140000.0,Museu d'Història de Catalunya,Pl Pau Vila,3.0,3.0,la Barceloneta,1.0,Ciutat Vella,8039.0,BARCELONA,932254700,Biblioteques,431896.431084,4581340.0,41.3807,2.185521
10,﻿93314142035,Biblioteca,92086020000.0,Agrupació Astronòmica Barcelona,C Viladomat,291.0,9.0,la Nova Esquerra de l'Eixample,2.0,Eixample,8029.0,BARCELONA,934514488,Biblioteques,428562.742307,4582231.0,41.388441,2.145551
12,﻿94166142341,CRAI - Biblioteca de Grau,92086000000.0,Facultat d'Economia i Empresa - UB,C John M. Keynes,1.0,21.0,Pedralbes,4.0,Les Corts,8034.0,BARCELONA,934021602,"Biblioteques, Sales d'estudi",426094.38333,4582094.0,41.386977,2.116048
14,﻿98030094836,Biblioteca,96248120000.0,Espeleo Club Gràcia,C Astúries,83.0,31.0,la Vila de Gràcia,6.0,Gràcia,8024.0,BARCELONA,934150460,Biblioteques,429489.334924,4584031.0,41.404734,2.156423
15,﻿97044191228,Biblioteca,75990150000.0,Fundació Pere Tarrés,C Santaló,37.0,26.0,Sant Gervasi - Galvany,5.0,Sarrià-Sant Gervasi,8021.0,BARCELONA,934152551,Biblioteques,428588.720886,4583025.0,41.395591,2.145768
16,﻿97063160238,Centre de Documentació Begoña Raventós -Biblio...,75990130000.0,Fundació Catalana de Síndrome de Down,C Comte Borrell,201.0,9.0,la Nova Esquerra de l'Eixample,2.0,Eixample,8029.0,BARCELONA,932151988,Biblioteques,429116.016012,4581840.0,41.384961,2.152214
18,﻿99103090600,Biblioteca - Centre d'Investigació i Desenvolu...,92086000000.0,Consell Superior d'Investigacions Científiques,C Jordi Girona,18.0,21.0,Pedralbes,4.0,Les Corts,8034.0,BARCELONA,934006100,Biblioteques,426003.0322,4582176.0,41.387707,2.114945


#### 6) Other Educational Equipment

In [90]:
display(education_equip_df.info())
print("\nSTATISTICS:\n")
#display(education_equip_df.describe())
non_null_cols, info_df = null_function(education_equip_df)
print("\nColumns with no null values:", non_null_cols)
print("\nColumns with null values:")
display(info_df)

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2698 entries, 0 to 2697
Data columns (total 39 columns):
 #   Column                         Non-Null Count  Dtype  
---  ------                         --------------  -----  
 0   register_id                    2698 non-null   object 
 1   name                           2698 non-null   object 
 2   institution_id                 227 non-null    float64
 3   institution_name               227 non-null    object 
 4   created                        2698 non-null   object 
 5   modified                       2698 non-null   object 
 6   addresses_roadtype_id          0 non-null      float64
 7   addresses_roadtype_name        0 non-null      float64
 8   addresses_road_id              2693 non-null   float64
 9   addresses_road_name            2693 non-null   object 
 10  addresses_start_street_number  2693 non-null   float64
 11  addresses_end_street_number    211 non-null    float64
 12  addresses_neighborhood_id      2693 non-null   f

None


STATISTICS:


Columns with no null values: Index(['register_id', 'name', 'created', 'modified', 'addresses_main_address'], dtype='object')

Columns with null values:


Unnamed: 0,Column,Null Count,Null Percentage
0,institution_id,2471,91.58636
1,institution_name,2471,91.58636
2,addresses_roadtype_id,2698,100.0
3,addresses_roadtype_name,2698,100.0
4,addresses_road_id,5,0.185322
5,addresses_road_name,5,0.185322
6,addresses_start_street_number,5,0.185322
7,addresses_end_street_number,2487,92.179392
8,addresses_neighborhood_id,5,0.185322
9,addresses_neighborhood_name,6,0.222387


*Seeing the amount of NULL values for each column, we will drop: institution_id, institution_name, addresses_roadtype_id, addresses_roadtype_name, addresses_end_street_number, addresses_type, values_description, estimated_dates, start_date, end_date. Also, the columns created and modified won't be used for the moment.*

In [91]:
# Drop columns with almost all null values
columns_to_drop_education_equip = ['created', 'modified', 'institution_id', 'institution_name', 'addresses_roadtype_id', 'addresses_roadtype_name' ,
                                  'addresses_end_street_number', 'addresses_type', 'values_description', 'estimated_dates', 'start_date', 'end_date']

education_equip_df.drop(columns=columns_to_drop_education_equip, inplace=True)

# Useless: Identifiador Via, Indicador si l'adreça, Valor de l'atribut identificador, Valor de l'atribut, Valors d'atribut Destacat,
# Arbres d'equivalència Identificador, Arbres d'equivalència Ruta, Arbres d'equivalència, Arbres d'equivalència  Id Asia
useless_cols = ['addresses_road_id', 'addresses_main_address', 'values_id', 'values_attribute_id', 'values_outstanding', 'secondary_filters_id',
                'secondary_filters_fullpath', 'secondary_filters_tree', 'secondary_filters_asia_id', 'values_category', 'values_attribute_name']
education_equip_df.drop(columns=useless_cols, inplace=True)
education_equip_df.head(10)

Unnamed: 0,register_id,name,addresses_road_name,addresses_start_street_number,addresses_neighborhood_id,addresses_neighborhood_name,addresses_district_id,addresses_district_name,addresses_zip_code,addresses_town,values_value,secondary_filters_name,geo_epgs_25831_x,geo_epgs_25831_y,geo_epgs_4326_lat,geo_epgs_4326_lon
0,﻿75990669728,Escola de Música Diesi,C Tinent Flomesta,6.0,18.0,Sants,3.0,Sants-Montjuïc,8028.0,BARCELONA,934310100,Música,427373.630181,4580770.0,41.375173,2.131505
1,﻿99400163935,Escola Bressol Municipal El Tramvia Blau,Pl Alfonso Comín,15.0,25.0,Sant Gervasi - la Bonanova,5.0,Sarrià-Sant Gervasi,8023.0,BARCELONA,932546358,Ensenyament infantil (0-3 anys),427898.560148,4585104.0,41.414251,2.137266
2,﻿99400163935,Escola Bressol Municipal El Tramvia Blau,Pl Alfonso Comín,15.0,25.0,Sant Gervasi - la Bonanova,5.0,Sarrià-Sant Gervasi,8023.0,BARCELONA,932546358,Escoles Bressol municipals,427898.560148,4585104.0,41.414251,2.137266
3,﻿99400132418,Escola de Dansa MagDanza,Av República Argentina,278.0,28.0,Vallcarca i els Penitents,6.0,Gràcia,8023.0,BARCELONA,934180436,,427970.827451,4585079.0,41.414032,2.138133
4,﻿75990548285,Utmúsica Associació Cultural,C Amílcar,173.0,35.0,el Guinardó,7.0,Horta-Guinardó,8032.0,BARCELONA,933478954,,430880.205994,4586066.0,41.423183,2.172829
5,﻿75990564145,La Nau Taller d'Arts Plàstiques,C Peris i Mencheta,23.0,36.0,la Font d'en Fargues,7.0,Horta-Guinardó,8032.0,BARCELONA,933580786,,430085.823626,4586452.0,41.426585,2.163279
6,﻿92168176499,Sala Beckett - Obrador Internacional de Dramat...,C Pere IV,228.0,68.0,el Poblenou,10.0,Sant Martí,8005.0,BARCELONA,932845312,Teatres,433085.99199,4583997.0,41.404734,2.199453
7,﻿75990032092,Centre Educatiu FEDAC-Horta,C Campoamor,49.0,43.0,Horta,7.0,Horta-Guinardó,8031.0,BARCELONA,934275496,Ensenyament infantil (3-6 anys),429419.29491,4587340.0,41.434525,2.155199
8,﻿75990032092,Centre Educatiu FEDAC-Horta,C Campoamor,49.0,43.0,Horta,7.0,Horta-Guinardó,8031.0,BARCELONA,934275496,Educació primària,429419.29491,4587340.0,41.434525,2.155199
9,﻿75990032092,Centre Educatiu FEDAC-Horta,C Campoamor,49.0,43.0,Horta,7.0,Horta-Guinardó,8031.0,BARCELONA,934275496,Educació secundària,429419.29491,4587340.0,41.434525,2.155199


In [92]:
# Observe New Info
#display(education_equip_df.info())

# Check if duplicates
has_duplicates(education_equip_df, 'register_id')

There's duplicate values in column register_id


In [93]:
# Print unique values for characteristics column before merging stuff
print("Unique Characteristics:\n")
print(education_equip_df['secondary_filters_name'].unique(), "\n")


# Remove weird characteristic (Teatres, CAPs, Discoteques, Restaurants, WiFi BCN, NaN)
education_equip_df.dropna(subset=['secondary_filters_name'], inplace=True)
education_equip_df = education_equip_df[education_equip_df['secondary_filters_name'] != 'Teatres']
education_equip_df = education_equip_df[education_equip_df['secondary_filters_name'] != 'WiFi BCN']
education_equip_df = education_equip_df[education_equip_df['secondary_filters_name'] != 'CAPs']
education_equip_df = education_equip_df[education_equip_df['secondary_filters_name'] != 'Discoteques']
education_equip_df = education_equip_df[education_equip_df['secondary_filters_name'] != 'Restaurants']
education_equip_df = education_equip_df[education_equip_df['secondary_filters_name'] != 'Fitness']
education_equip_df = education_equip_df[education_equip_df['secondary_filters_name'] != 'Gimnàstica']
education_equip_df = education_equip_df[education_equip_df['secondary_filters_name'] != 'Ioga']
education_equip_df = education_equip_df[education_equip_df['secondary_filters_name'] != 'Instal·lacions esportives']
education_equip_df = education_equip_df[education_equip_df['secondary_filters_name'] != 'Altres esports']
education_equip_df = education_equip_df[education_equip_df['secondary_filters_name'] != 'Grans establiments']
education_equip_df = education_equip_df[education_equip_df['secondary_filters_name'] != 'Habitatges tutelats']
education_equip_df = education_equip_df[education_equip_df['secondary_filters_name'] != 'Residències gent gran']
education_equip_df = education_equip_df[education_equip_df['secondary_filters_name'] != 'Altres']

# Aggregate secondary_filters_name (caract.) by register_id and replace column
aggregated_sec_filters = education_equip_df.groupby('register_id')['secondary_filters_name'].transform(lambda x: ', '.join(x))
education_equip_df['secondary_filters_name'] = aggregated_sec_filters
#display(education_equip_df.head(10))

# Drop duplicated register_id
education_equip_df.drop_duplicates(subset='register_id', inplace=True)
display(education_equip_df.head(10))

Unique Characteristics:

['Música' 'Ensenyament infantil (0-3 anys)' 'Escoles Bressol municipals'
 nan 'Teatres' 'Ensenyament infantil (3-6 anys)' 'Educació primària'
 'Educació secundària' 'Formació professional' 'Universitats' 'Idiomes'
 'Informàtica' 'CAPs' 'Altres esports' 'Gimnàstica' 'Ioga'
 'Instal·lacions esportives' 'Adults' 'Grans establiments'
 'Residències gent gran' 'Habitatges tutelats' 'Discoteques' 'Fitness'
 'Restaurants' 'Biblioteques' 'Altres' "Sales d'estudi" 'WiFi BCN'] 



Unnamed: 0,register_id,name,addresses_road_name,addresses_start_street_number,addresses_neighborhood_id,addresses_neighborhood_name,addresses_district_id,addresses_district_name,addresses_zip_code,addresses_town,values_value,secondary_filters_name,geo_epgs_25831_x,geo_epgs_25831_y,geo_epgs_4326_lat,geo_epgs_4326_lon
0,﻿75990669728,Escola de Música Diesi,C Tinent Flomesta,6.0,18.0,Sants,3.0,Sants-Montjuïc,8028.0,BARCELONA,934310100,Música,427373.630181,4580770.0,41.375173,2.131505
1,﻿99400163935,Escola Bressol Municipal El Tramvia Blau,Pl Alfonso Comín,15.0,25.0,Sant Gervasi - la Bonanova,5.0,Sarrià-Sant Gervasi,8023.0,BARCELONA,932546358,"Ensenyament infantil (0-3 anys), Escoles Bress...",427898.560148,4585104.0,41.414251,2.137266
7,﻿75990032092,Centre Educatiu FEDAC-Horta,C Campoamor,49.0,43.0,Horta,7.0,Horta-Guinardó,8031.0,BARCELONA,934275496,"Ensenyament infantil (3-6 anys), Educació prim...",429419.29491,4587340.0,41.434525,2.155199
10,﻿75990064070,Escola Universitària Formàtic Barcelona,Pg Gràcia,71.0,7.0,la Dreta de l'Eixample,2.0,Eixample,8008.0,BARCELONA,932156800,"Formació professional, Universitats",430006.371161,4582782.0,41.393529,2.162753
15,﻿75990475941,Centre Educatiu Sopeña Barcelona,C Violant Hongria Rna Aragó,39.0,17.0,Sants - Badal,3.0,Sants-Montjuïc,8028.0,BARCELONA,933390544,"Educació secundària, Formació professional",427115.631618,4581099.0,41.378111,2.128381
17,﻿99400197947,Escola La Maquinista,Carrer de Ferran Junoy,14.0,59.0,el Bon Pastor,9.0,Sant Andreu,8030.0,Barcelona,933118438,"Ensenyament infantil (3-6 anys), Educació prim...",432816.050226,4587805.0,41.439012,2.1958
19,﻿99400188451,SMOS Barcelona Expert Centre,Passeig Marítim de la Barceloneta - Oriol Bohigas,37.0,3.0,la Barceloneta,1.0,Ciutat Vella,8003.0,Barcelona,932309500,Universitats,432785.003337,4581878.0,41.385621,2.196087
20,﻿1081092719,Escola Ferran Sunyer,C Viladomat,2.0,10.0,Sant Antoni,2.0,Eixample,8015.0,BARCELONA,933248442,"Ensenyament infantil (3-6 anys), Educació prim...",430024.067395,4580829.0,41.375936,2.16319
22,﻿75990085586,Deutschstunde-Centro Aleman,Gran de Gràcia,10.0,31.0,la Vila de Gràcia,6.0,Gràcia,8012.0,BARCELONA,932376322,Idiomes,429576.340229,4583310.0,41.398242,2.157548
25,﻿99400155198,Escola Bressol Municipal Carabassa,C Carabassa,8.0,2.0,el Barri Gòtic,1.0,Ciutat Vella,8002.0,BARCELONA,933435106,"Ensenyament infantil (0-3 anys), Escoles Bress...",431312.759771,4581280.0,41.380111,2.178548


In [94]:
# Rename Columns
education_equip_df = education_equip_df.rename(columns={"name": "Name", "addresses_road_name": "Road Name", "addresses_start_street_number": "Street Number",
                                                      "addresses_neighborhood_id": "Neighborhood ID", "addresses_neighborhood_name": "Neighborhood Name",
                                                      "addresses_district_id": "District ID", "addresses_district_name": "District Name",
                                                      "addresses_zip_code": "ZipCode","addresses_town": "Town",
                                                      "values_value": "Phone Number", "secondary_filters_name": "Service Type",
                                                      "geo_epgs_4326_lat": "Latitude", "geo_epgs_4326_lon": "Longitude"})
display(education_equip_df.head(10))

Unnamed: 0,register_id,Name,Road Name,Street Number,Neighborhood ID,Neighborhood Name,District ID,District Name,ZipCode,Town,Phone Number,Service Type,geo_epgs_25831_x,geo_epgs_25831_y,Latitude,Longitude
0,﻿75990669728,Escola de Música Diesi,C Tinent Flomesta,6.0,18.0,Sants,3.0,Sants-Montjuïc,8028.0,BARCELONA,934310100,Música,427373.630181,4580770.0,41.375173,2.131505
1,﻿99400163935,Escola Bressol Municipal El Tramvia Blau,Pl Alfonso Comín,15.0,25.0,Sant Gervasi - la Bonanova,5.0,Sarrià-Sant Gervasi,8023.0,BARCELONA,932546358,"Ensenyament infantil (0-3 anys), Escoles Bress...",427898.560148,4585104.0,41.414251,2.137266
7,﻿75990032092,Centre Educatiu FEDAC-Horta,C Campoamor,49.0,43.0,Horta,7.0,Horta-Guinardó,8031.0,BARCELONA,934275496,"Ensenyament infantil (3-6 anys), Educació prim...",429419.29491,4587340.0,41.434525,2.155199
10,﻿75990064070,Escola Universitària Formàtic Barcelona,Pg Gràcia,71.0,7.0,la Dreta de l'Eixample,2.0,Eixample,8008.0,BARCELONA,932156800,"Formació professional, Universitats",430006.371161,4582782.0,41.393529,2.162753
15,﻿75990475941,Centre Educatiu Sopeña Barcelona,C Violant Hongria Rna Aragó,39.0,17.0,Sants - Badal,3.0,Sants-Montjuïc,8028.0,BARCELONA,933390544,"Educació secundària, Formació professional",427115.631618,4581099.0,41.378111,2.128381
17,﻿99400197947,Escola La Maquinista,Carrer de Ferran Junoy,14.0,59.0,el Bon Pastor,9.0,Sant Andreu,8030.0,Barcelona,933118438,"Ensenyament infantil (3-6 anys), Educació prim...",432816.050226,4587805.0,41.439012,2.1958
19,﻿99400188451,SMOS Barcelona Expert Centre,Passeig Marítim de la Barceloneta - Oriol Bohigas,37.0,3.0,la Barceloneta,1.0,Ciutat Vella,8003.0,Barcelona,932309500,Universitats,432785.003337,4581878.0,41.385621,2.196087
20,﻿1081092719,Escola Ferran Sunyer,C Viladomat,2.0,10.0,Sant Antoni,2.0,Eixample,8015.0,BARCELONA,933248442,"Ensenyament infantil (3-6 anys), Educació prim...",430024.067395,4580829.0,41.375936,2.16319
22,﻿75990085586,Deutschstunde-Centro Aleman,Gran de Gràcia,10.0,31.0,la Vila de Gràcia,6.0,Gràcia,8012.0,BARCELONA,932376322,Idiomes,429576.340229,4583310.0,41.398242,2.157548
25,﻿99400155198,Escola Bressol Municipal Carabassa,C Carabassa,8.0,2.0,el Barri Gòtic,1.0,Ciutat Vella,8002.0,BARCELONA,933435106,"Ensenyament infantil (0-3 anys), Escoles Bress...",431312.759771,4581280.0,41.380111,2.178548


### 1.3. Dataset Merging

- Datasets with same columns: schools_reglat_df, schools_no_reglat_df, kindergartens_df, libraries_studroom_df, education_equip_df

- Datasets with different columns: libraries_df

In [95]:
# Data Merging (same columns)
education_df = pd.concat([schools_reglat_df, schools_no_reglat_df, kindergartens_df, libraries_studroom_df, education_equip_df], ignore_index=True)

# Drop duplicates
education_df = education_df.drop_duplicates(subset='register_id', keep='first')
display(education_df)

Unnamed: 0,register_id,Name,Road Name,Street Number,Neighborhood ID,Neighborhood Name,District ID,District Name,ZipCode,Town,Phone Number,Service Type,geo_epgs_25831_x,geo_epgs_25831_y,Latitude,Longitude,institution_id,institution_name
0,﻿92086000496,Facultat d'Informació i Mitjans Audiovisuals - UB,Melcior de Palau,140.0,18.0,Sants,3.0,Sants-Montjuïc,8014.0,BARCELONA,934035770,Universitats,427989.387049,4.581443e+06,41.381286,2.138788,,
1,﻿92086008555,Institut Fort Pius,C Ausiàs Marc,78.0,5.0,el Fort Pienc,2.0,Eixample,8013.0,BARCELONA,932316013,Educació secundària,431433.012280,4.582861e+06,41.394359,2.179807,,
2,﻿75990047979,Escola Pia de Nostra Senyora,Carrer de la Diputació,277.0,7.0,la Dreta de l'Eixample,2.0,Eixample,8007.0,Barcelona,934881166,"Educació secundària, Formació professional",430435.525044,4.582521e+06,41.391216,2.167916,,
3,﻿92168166051,Institut Salvador Seguí,C Santander,7.0,73.0,la Verneda i la Pau,10.0,Sant Martí,8020.0,BARCELONA,933142041,Formació professional,432882.376561,4.586038e+06,41.423094,2.196790,,
4,﻿92168166070,Escola de Música Kostka,Rier Can Toda,29.0,30.0,la Salut,6.0,Gràcia,8024.0,BARCELONA,932103605,Música,429568.000936,4.585099e+06,41.414357,2.157240,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1788,﻿249121118,Biblioteca Vapor Vell,Passatge del Vapor Vell,1.0,18.0,Sants,3.0,Sants-Montjuïc,8028.0,Barcelona,934097231,"Biblioteques, Biblioteques municipals, Sales d...",427647.080480,4.580962e+06,41.376929,2.134752,,
1789,﻿92086008284,Biblioteca,C Ciutat de Balaguer,17.0,25.0,Sant Gervasi - la Bonanova,5.0,Sarrià-Sant Gervasi,8022.0,BARCELONA,934181720,Biblioteques,427790.780472,4.583811e+06,41.402602,2.136130,9.208601e+10,Escola Superior de Disseny i d'Art Llotja
1790,﻿92086000482,Biblioteca Sant Pau - Santa Creu,Carrer del Carme,47.0,1.0,el Raval,1.0,Ciutat Vella,8001.0,Barcelona,933020797,"Biblioteques, Biblioteques municipals, Sales d...",430513.782506,4.581444e+06,41.381524,2.168975,,
1791,﻿284153819,Biblioteca Les Corts - Miquel Llongueras,Travessera de les Corts,58.0,20.0,la Maternitat i Sant Ramon,4.0,Les Corts,8028.0,Barcelona,934493107,"Biblioteques, Biblioteques municipals, Sales d...",426568.770937,4.581093e+06,41.378006,2.121842,,


In [96]:
# Different columns
drop_merge_lib = ['Year', 'Indicator', 'Ownership', 'Use', 'Scope', 'Id']
libraries_df.drop(columns=drop_merge_lib, inplace=True)
#libraries_df.info()
display(libraries_df)

Unnamed: 0,Name,District ID,District Name,Neighborhood ID,Neighborhood Name,Service Type,Latitude,Longitude
0,Biblioteca Barceloneta - La Fraternitat,1,Ciutat Vella,3,la Barceloneta,Biblioteques de Barcelona,41.379201,2.188854
1,Biblioteca Francesca Bonnemaison,1,Ciutat Vella,4,"Sant Pere, Santa Caterina i la Ribera",Biblioteques de Barcelona,41.386937,2.17579
2,Biblioteca Gòtic - Andreu Nin,1,Ciutat Vella,2,el Barri Gòtic,Biblioteques de Barcelona,41.37873,2.175979
3,Biblioteca Sant Pau - Santa Creu,1,Ciutat Vella,1,el Raval,Biblioteques de Barcelona,41.381057,2.169794
4,Biblioteca Esquerra de l'Eixample - Agustí Cen...,2,Eixample,9,la Nova Esquerra de l'Eixample,Biblioteques de Barcelona,41.386449,2.15279
5,Biblioteca Fort Pienc,2,Eixample,5,el Fort Pienc,Biblioteques de Barcelona,41.395555,2.182448
6,Biblioteca Joan Miró,2,Eixample,9,la Nova Esquerra de l'Eixample,Biblioteques de Barcelona,41.378817,2.14923
7,Biblioteca Sagrada Família - J. M. Ainaud de L...,2,Eixample,6,la Sagrada Família,Biblioteques de Barcelona,41.405577,2.176118
8,Biblioteca Sant Antoni - Joan Oliver,2,Eixample,10,Sant Antoni,Biblioteques de Barcelona,41.377385,2.162778
9,Biblioteca Sofia Barat,2,Eixample,7,la Dreta de l'Eixample,Biblioteques de Barcelona,41.394674,2.171504


In [97]:
drop_merge_education = ['Phone Number', 'Town', 'institution_id', 'institution_name', 'register_id']
education_df.drop(columns=drop_merge_education, inplace=True)
education_df.info()
display(education_df)

<class 'pandas.core.frame.DataFrame'>
Int64Index: 1448 entries, 0 to 1792
Data columns (total 13 columns):
 #   Column             Non-Null Count  Dtype  
---  ------             --------------  -----  
 0   Name               1448 non-null   object 
 1   Road Name          1444 non-null   object 
 2   Street Number      1442 non-null   float64
 3   Neighborhood ID    1444 non-null   float64
 4   Neighborhood Name  1444 non-null   object 
 5   District ID        1444 non-null   float64
 6   District Name      1444 non-null   object 
 7   ZipCode            1444 non-null   float64
 8   Service Type       1448 non-null   object 
 9   geo_epgs_25831_x   1448 non-null   float64
 10  geo_epgs_25831_y   1448 non-null   float64
 11  Latitude           1448 non-null   float64
 12  Longitude          1448 non-null   float64
dtypes: float64(8), object(5)
memory usage: 158.4+ KB


Unnamed: 0,Name,Road Name,Street Number,Neighborhood ID,Neighborhood Name,District ID,District Name,ZipCode,Service Type,geo_epgs_25831_x,geo_epgs_25831_y,Latitude,Longitude
0,Facultat d'Informació i Mitjans Audiovisuals - UB,Melcior de Palau,140.0,18.0,Sants,3.0,Sants-Montjuïc,8014.0,Universitats,427989.387049,4.581443e+06,41.381286,2.138788
1,Institut Fort Pius,C Ausiàs Marc,78.0,5.0,el Fort Pienc,2.0,Eixample,8013.0,Educació secundària,431433.012280,4.582861e+06,41.394359,2.179807
2,Escola Pia de Nostra Senyora,Carrer de la Diputació,277.0,7.0,la Dreta de l'Eixample,2.0,Eixample,8007.0,"Educació secundària, Formació professional",430435.525044,4.582521e+06,41.391216,2.167916
3,Institut Salvador Seguí,C Santander,7.0,73.0,la Verneda i la Pau,10.0,Sant Martí,8020.0,Formació professional,432882.376561,4.586038e+06,41.423094,2.196790
4,Escola de Música Kostka,Rier Can Toda,29.0,30.0,la Salut,6.0,Gràcia,8024.0,Música,429568.000936,4.585099e+06,41.414357,2.157240
...,...,...,...,...,...,...,...,...,...,...,...,...,...
1788,Biblioteca Vapor Vell,Passatge del Vapor Vell,1.0,18.0,Sants,3.0,Sants-Montjuïc,8028.0,"Biblioteques, Biblioteques municipals, Sales d...",427647.080480,4.580962e+06,41.376929,2.134752
1789,Biblioteca,C Ciutat de Balaguer,17.0,25.0,Sant Gervasi - la Bonanova,5.0,Sarrià-Sant Gervasi,8022.0,Biblioteques,427790.780472,4.583811e+06,41.402602,2.136130
1790,Biblioteca Sant Pau - Santa Creu,Carrer del Carme,47.0,1.0,el Raval,1.0,Ciutat Vella,8001.0,"Biblioteques, Biblioteques municipals, Sales d...",430513.782506,4.581444e+06,41.381524,2.168975
1791,Biblioteca Les Corts - Miquel Llongueras,Travessera de les Corts,58.0,20.0,la Maternitat i Sant Ramon,4.0,Les Corts,8028.0,"Biblioteques, Biblioteques municipals, Sales d...",426568.770937,4.581093e+06,41.378006,2.121842


In [98]:
# Final Data Merging (dif columns)
education_df = pd.concat([education_df, libraries_df], ignore_index=True)

# Convertir la columna 'Neighborhood ID', 'District ID', 'ZipCode', 'ABS ID' and 'Sanitary Sector ID' a tipo entero (1º NaN a 0, 2º Values to int)
# Street Number NO, because there can be 'bis'

education_df['Neighborhood ID'].fillna(value=0, inplace=True)
education_df['Neighborhood ID'] = education_df['Neighborhood ID'].astype(int)
education_df['District ID'].fillna(value=0, inplace=True)
education_df['District ID'] = education_df['District ID'].astype(int)
education_df['ZipCode'].fillna(value=0, inplace=True)
education_df['ZipCode'] = education_df['ZipCode'].astype(int)

# Drop duplicates
education_df = education_df.drop_duplicates(subset='Name', keep='first')
display(education_df)

Unnamed: 0,Name,Road Name,Street Number,Neighborhood ID,Neighborhood Name,District ID,District Name,ZipCode,Service Type,geo_epgs_25831_x,geo_epgs_25831_y,Latitude,Longitude
0,Facultat d'Informació i Mitjans Audiovisuals - UB,Melcior de Palau,140.0,18,Sants,3,Sants-Montjuïc,8014,Universitats,427989.387049,4.581443e+06,41.381286,2.138788
1,Institut Fort Pius,C Ausiàs Marc,78.0,5,el Fort Pienc,2,Eixample,8013,Educació secundària,431433.012280,4.582861e+06,41.394359,2.179807
2,Escola Pia de Nostra Senyora,Carrer de la Diputació,277.0,7,la Dreta de l'Eixample,2,Eixample,8007,"Educació secundària, Formació professional",430435.525044,4.582521e+06,41.391216,2.167916
3,Institut Salvador Seguí,C Santander,7.0,73,la Verneda i la Pau,10,Sant Martí,8020,Formació professional,432882.376561,4.586038e+06,41.423094,2.196790
4,Escola de Música Kostka,Rier Can Toda,29.0,30,la Salut,6,Gràcia,8024,Música,429568.000936,4.585099e+06,41.414357,2.157240
...,...,...,...,...,...,...,...,...,...,...,...,...,...
1475,Biblioteca Trinitat Vella - José Barbero,,,57,la Trinitat Vella,9,Sant Andreu,0,Biblioteques de Barcelona,,,41.449283,2.190749
1479,Biblioteca Poblenou - Manuel Arranz,,,68,el Poblenou,10,Sant Martí,0,Biblioteques de Barcelona,,,41.401373,2.204526
1480,Biblioteca Ramon d'Alòs-Moner,,,70,el Besòs i el Maresme,10,Sant Martí,0,Biblioteques de Barcelona,,,41.416309,2.211483
1483,Biblioteca Poble Sec - Francesc Boix,,,11,el Poble Sec,3,Sants-Montjuïc,0,Biblioteques de Barcelona,,,41.373922,2.164025


In [99]:
cols = education_df.columns.tolist()

for col in cols:
    print(col,"Nulls:",education_df[col].isnull().sum())

Name Nulls: 0
Road Name Nulls: 18
Street Number Nulls: 18
Neighborhood ID Nulls: 0
Neighborhood Name Nulls: 2
District ID Nulls: 0
District Name Nulls: 2
ZipCode Nulls: 0
Service Type Nulls: 0
geo_epgs_25831_x Nulls: 16
geo_epgs_25831_y Nulls: 16
Latitude Nulls: 0
Longitude Nulls: 0


### Revise Types

In [100]:
education_df['Service Type'].unique()

array(['Universitats', 'Educació secundària',
       'Educació secundària, Formació professional',
       'Formació professional', 'Música',
       'Ensenyament infantil (3-6 anys), Educació primària, Educació secundària',
       'Ensenyament infantil (3-6 anys), Educació primària',
       'Ensenyament infantil (0-3 anys), Ensenyament infantil (3-6 anys), Educació primària, Educació secundària',
       'Formació professional, Universitats',
       'Educació primària, Educació secundària',
       'Adults, Formació professional',
       'Ensenyament infantil (0-3 anys), Ensenyament infantil (3-6 anys), Educació primària, Educació secundària, Formació professional',
       'Biblioteques, Universitats',
       'Ensenyament infantil (3-6 anys), Educació primària, Educació secundària, Formació professional',
       'Idiomes, Formació professional', "Sales d'estudi, Universitats",
       'Ensenyament infantil (0-3 anys), Ensenyament infantil (3-6 anys), Educació primària',
       'Educació pr

In [101]:
#display(education_df[education_df['Service Type'] == "Biblioteques, Sales d'estudi"])
#display(education_df[education_df['Service Type'] == "Biblioteques, Biblioteques municipals, Sales d'estudi"])
#display(education_df[education_df['Service Type'] == "Sales d'estudi"])
#display(education_df[education_df['Service Type'] == 'Música'])
#display(education_df[education_df['Service Type'] == 'Música, Universitats'])
#display(education_df[education_df['Service Type'] == 'Idiomes'])
#display(education_df[education_df['Service Type'] == 'Idiomes, Informàtica'])
#display(education_df[education_df['Service Type'] == 'Adults, Idiomes'])
#display(education_df[education_df['Service Type'] == 'Adults'])
#display(education_df[education_df['Service Type'] == 'Adults, Idiomes, Informàtica'])
#display(education_df[education_df['Service Type'] == 'Informàtica'])
#display(education_df[education_df['Service Type'] == 'Ensenyament infantil (0-3 anys), Ensenyament infantil (3-6 anys)'])
#display(education_df[education_df['Service Type'] == 'Ensenyament infantil (3-6 anys), Adults, Educació primària, Educació secundària, Formació professional'])
#display(education_df[education_df['Service Type'] == 'Ensenyament infantil (0-3 anys), Ensenyament infantil (3-6 anys), Educació primària, Educació secundària, Formació professional'])
display(education_df[education_df['Service Type'] == 'Informàtica, Educació secundària, Formació professional'])


Unnamed: 0,Name,Road Name,Street Number,Neighborhood ID,Neighborhood Name,District ID,District Name,ZipCode,Service Type,geo_epgs_25831_x,geo_epgs_25831_y,Latitude,Longitude
405,"CEV, Centre de Comunicació, Imatge i So",Carrer del Perú,174.0,71,Provençals del Poblenou,10,Sant Martí,8020,"Informàtica, Educació secundària, Formació pro...",433239.842,4584813.714,41.412101,2.201203


In [102]:
# Mapping and renamings
mappings = {
    # Libraries
    "Biblioteques, Sales d'estudi": 'Library & Study Room',
    'Biblioteques': 'Library & Study Room',
    "Biblioteques, Biblioteques municipals, Sales d'estudi": 'Library & Study Room',
    "Sales d'estudi": 'Library & Study Room',
    'Biblioteques, Biblioteques municipals': 'Library & Study Room',
    'Biblioteques de Barcelona': 'Library & Study Room',
    'Biblioteques, Universitats': 'Library & Study Room',
    #Music
    'Música': 'Music School',
    'Música, Universitats': 'Music School', # Escola de Música de Bcn
    # Languages
    'Idiomes': 'Languages School',
    'Idiomes, Formació professional': 'Languages School',
    # Changs will be done manually
    'Idiomes, Informàtica': 'Informatics & Languages',
    #Adults
    'Adults, Idiomes': 'Adult Training',
    'Adults': 'Adult Training',
    'Adults, Idiomes, Informàtica': 'FP',
    'Adults, Educació secundària, Formació professional': 'FP',
    # Changes will be done manually
    'Adults, Formació professional': 'Adult Training & FP',
    'Informàtica': 'Informatics Training',
    # Kindergarten (0-6)
    'Ensenyament infantil (0-3 anys)': 'Kindergarten',
    'Ensenyament infantil (0-3 anys), Escoles Bressol municipals': 'Kindergarten',
    'Ensenyament infantil (0-3 anys), Ensenyament infantil (3-6 anys)': 'Kindergarten',
    'Ensenyament infantil (3-6 anys)': 'Kindergarten',
    'Universitats': 'University',
    'Formació professional, Universitats': 'University',
    "Sales d'estudi, Universitats": 'University',
    # SCHOOLS
    'Educació primària': 'Primary School',
    'Educació secundària': 'Secondary School',
    'Formació professional': 'FP',
    'Ensenyament infantil (3-6 anys), Educació primària, Educació secundària': 'Kindergarten, Primary & Secondary School',
    'Ensenyament infantil (0-3 anys), Ensenyament infantil (3-6 anys), Educació primària, Educació secundària': 'Kindergarten, Primary & Secondary School',
    'Ensenyament infantil (3-6 anys), Educació primària': 'Kindergarten & Primary School',
    'Ensenyament infantil (0-3 anys), Ensenyament infantil (3-6 anys), Educació primària': 'Kindergarten & Primary School',
    'Educació primària, Educació secundària': 'Primary & Secondary School',
    'Ensenyament infantil (0-3 anys), Ensenyament infantil (3-6 anys), Educació primària, Educació secundària, Formació professional': 'Kindergarten, Primary, Secondary School & FP',
    'Ensenyament infantil (3-6 anys), Educació primària, Educació secundària, Formació professional': 'Kindergarten, Primary, Secondary School & FP',
    'Ensenyament infantil (3-6 anys), Adults, Educació primària, Educació secundària, Formació professional': 'Kindergarten, Primary, Secondary School & FP',
    'Educació secundària, Formació professional': 'Secondary School & FP',
    'Educació primària, Educació secundària, Música': 'Primary & Secondary Music School',
    'Educació primària, Educació secundària, Formació professional': 'Primary, Secondary School & FP',
    'Adults, Idiomes, Educació secundària, Formació professional': 'FP',
    'Informàtica, Educació secundària, Formació professional': 'Informatics Training',
}

education_df['Service Type'] = education_df['Service Type'].replace(mappings)
#display(education_df)

In [103]:
education_df['Service Type'].unique()

array(['University', 'Secondary School', 'Secondary School & FP', 'FP',
       'Music School', 'Kindergarten, Primary & Secondary School',
       'Kindergarten & Primary School', 'Primary & Secondary School',
       'Adult Training & FP',
       'Kindergarten, Primary, Secondary School & FP',
       'Library & Study Room', 'Languages School',
       'Primary & Secondary Music School', 'Informatics Training',
       'Primary School', 'Primary, Secondary School & FP',
       'Informatics & Languages', 'Adult Training', 'Kindergarten'],
      dtype=object)

### Check manually: Adult Training & FP, Informatics & Languages

In [104]:
display(education_df[education_df['Service Type'] == 'Adult Training & FP'])

Unnamed: 0,Name,Road Name,Street Number,Neighborhood ID,Neighborhood Name,District ID,District Name,ZipCode,Service Type,geo_epgs_25831_x,geo_epgs_25831_y,Latitude,Longitude
56,Centre Educatiu Forma't,C Vilardell,38.0,15,Hostafrancs,3,Sants-Montjuïc,8014,Adult Training & FP,428400.727211,4580687.0,41.374515,2.143796
122,Granja-Escola Sinaí,C Indústria,137.0,6,la Sagrada Família,2,Eixample,8025,Adult Training & FP,430900.649112,4584526.0,41.409313,2.17325
323,Centre Educatiu Thuya,Sant Gervasi de Cassoles,68.0,25,Sant Gervasi - la Bonanova,5,Sarrià-Sant Gervasi,8022,Adult Training & FP,427852.2308,4584159.0,41.405741,2.136824
436,Centre Educatiu Stucom Pelai,C Pelai,8.0,1,el Raval,1,Ciutat Vella,8001,Adult Training & FP,430210.932351,4581922.0,41.385799,2.165298
622,Centre Educatiu Prat *Roger de Llúria,C Roger de Llúria,97.0,7,la Dreta de l'Eixample,2,Eixample,8009,Adult Training & FP,430223.217015,4582966.0,41.395208,2.165325
717,Centre de Formació Professional Cruïlla,Avinguda d'Escolapi Càncer,4.0,54,Torre Baró,8,Nou Barris,8033,Adult Training & FP,431564.315744,4590101.0,41.459584,2.180558
800,Centre Educatiu ESEP,Carrer de Caballero,44.0,19,les Corts,4,Les Corts,8014,Adult Training & FP,427799.286,4581642.0,41.383067,2.136491


In [105]:
# Based on Google Search - Adult Training & FP
# Centre Educatiu Forma't	C: FP
education_df.at[56, 'Service Type'] = 'FP'
# Granja-Escola Sinaí: FP
education_df.at[122, 'Service Type'] = 'FP'
# Centre Educatiu Thuya: FP
education_df.at[323, 'Service Type'] = 'FP'
# Centre Educatiu Stucom Pelai: FP
education_df.at[436, 'Service Type'] = 'FP'
# Centre Educatiu Prat *Roger de Llúria: FP
education_df.at[622, 'Service Type'] = 'FP'
# Centre de Formació Professional Cruïlla: FP
education_df.at[717, 'Service Type'] = 'FP'
#Centre Educatiu ESEP: Adult Training
education_df.at[800, 'Service Type'] = 'Adult Training'
#

In [106]:
display(education_df[education_df['Service Type'] == 'Informatics & Languages'])

Unnamed: 0,Name,Road Name,Street Number,Neighborhood ID,Neighborhood Name,District ID,District Name,ZipCode,Service Type,geo_epgs_25831_x,geo_epgs_25831_y,Latitude,Longitude
805,Escola Professional de la Dona,C Sant Pere Més Baix,7.0,4,"Sant Pere, Santa Caterina i la Ribera",1,Ciutat Vella,8003,Informatics & Languages,431090.839773,4582043.0,41.386968,2.175808
816,Centre d'Estudis Master,C Provença,463.0,6,la Sagrada Família,2,Eixample,8025,Informatics & Languages,431107.606186,4584113.0,41.405614,2.175773
818,Meca-Ràpid *Av Meridiana,Av Meridiana,326.0,61,la Sagrera,9,Sant Andreu,8027,Informatics & Languages,432077.120325,4586307.0,41.425457,2.187124
828,General Formació *Escultors Claperós,C Escultors Claperós,36.0,65,el Clot,10,Sant Martí,8018,Informatics & Languages,432227.249282,4584250.0,41.406938,2.189151
853,Tecniber-5,Padilla,395.0,33,el Baix Guinardó,7,Horta-Guinardó,8025,Informatics & Languages,430484.27009,4584847.0,41.41217,2.168231
858,Clot Formació,C Muntanya,2.0,65,el Clot,10,Sant Martí,8026,Informatics & Languages,432223.113236,4584677.0,41.410782,2.189054
868,Institut d'Estudis Moderns,Gran de Sant Andreu,181.0,60,Sant Andreu,9,Sant Andreu,8030,Informatics & Languages,432261.997362,4587142.0,41.432987,2.189243
874,Acadèmia Accés,de Lope de Vega,100.0,68,el Poblenou,10,Sant Martí,8005,Informatics & Languages,433436.874586,4583973.0,41.40455,2.203653
877,Centre Estudis Sistemes Informàtics,Jota,73.0,44,Vilapicina i la Torre Llobeta,8,Nou Barris,8016,Informatics & Languages,431417.458638,4586755.0,41.429434,2.17918
878,La Troca. Escola Comunitària de Formació Perma...,C Olzinelles,31.0,18,Sants,3,Sants-Montjuïc,8014,Informatics & Languages,427805.406037,4580515.0,41.372918,2.136698


In [107]:
# Based on Google Search - Informatics & Language
# Escola Professional de la Dona: Adult Training
education_df.at[805, 'Service Type'] = 'Adult Training'
# Centre d'Estudis Master: FP
education_df.at[816, 'Service Type'] = 'FP'
# Meca-Ràpid *Av Meridiana: Informatics
education_df.at[818, 'Service Type'] = 'Informatics Training'
# General Formació *Escultors Claperós: FP
education_df.at[828, 'Service Type'] = 'FP'
# Tecniber-5: Informatics
education_df.at[853, 'Service Type'] = 'Informatics Training'
# Clot Formació: FP (+ Kindergarten, Primary, Secondary School)
education_df.at[858, 'Service Type'] = 'Kindergarten, Primary, Secondary School & FP'
# Institut d'Estudis Moderns: Languages
education_df.at[868, 'Service Type'] = 'Languages School'
# Acadèmia Accés: Languages
education_df.at[874, 'Service Type'] = 'Languages School'
# Centre Estudis Sistemes Informàtics: Informatics
education_df.at[877, 'Service Type'] = 'Informatics Training'
# La Troca. Escola Comunitària de Formació Permanent: Adult Training
education_df.at[878, 'Service Type'] = 'Adult Training'
# Centre de Joves i Adults: Adult
education_df.at[891, 'Service Type'] = 'Adult Training'
# Escola d'Ensenyaments Especialitzats: permanently closed
education_df = education_df[education_df['Name'] != "Escola d'Ensenyaments Especialitzats"]
# La Acadèmia de les Corts: Languages
education_df.at[946, 'Service Type'] = 'Languages School'
# L'Aula Sants Formació: permanently closed
education_df = education_df[education_df['Name'] != "L'Aula Sants Formació"]

In [108]:
education_df['Service Type'].unique()

array(['University', 'Secondary School', 'Secondary School & FP', 'FP',
       'Music School', 'Kindergarten, Primary & Secondary School',
       'Kindergarten & Primary School', 'Primary & Secondary School',
       'Kindergarten, Primary, Secondary School & FP',
       'Library & Study Room', 'Languages School',
       'Primary & Secondary Music School', 'Informatics Training',
       'Primary School', 'Primary, Secondary School & FP',
       'Adult Training', 'Kindergarten'], dtype=object)

In [109]:
# Simplify Type
education_df['Simple Service Type'] = education_df['Service Type']

# Mapping and renamings
simp_mappings = {
    'Secondary School': 'High School',
    'Secondary School & FP': 'High School',
    'Kindergarten, Primary & Secondary School': 'General School (with kindergarten)',
    'Kindergarten, Primary, Secondary School & FP': 'General School (with kindergarten)',
    'Primary, Secondary School & FP': 'General School',
    'Primary & Secondary Music School': 'General School',
    'Primary & Secondary School': 'General School',
}

education_df['Simple Service Type'] = education_df['Simple Service Type'].replace(simp_mappings)
display(education_df)

Unnamed: 0,Name,Road Name,Street Number,Neighborhood ID,Neighborhood Name,District ID,District Name,ZipCode,Service Type,geo_epgs_25831_x,geo_epgs_25831_y,Latitude,Longitude,Simple Service Type
0,Facultat d'Informació i Mitjans Audiovisuals - UB,Melcior de Palau,140.0,18,Sants,3,Sants-Montjuïc,8014,University,427989.387049,4.581443e+06,41.381286,2.138788,University
1,Institut Fort Pius,C Ausiàs Marc,78.0,5,el Fort Pienc,2,Eixample,8013,Secondary School,431433.012280,4.582861e+06,41.394359,2.179807,High School
2,Escola Pia de Nostra Senyora,Carrer de la Diputació,277.0,7,la Dreta de l'Eixample,2,Eixample,8007,Secondary School & FP,430435.525044,4.582521e+06,41.391216,2.167916,High School
3,Institut Salvador Seguí,C Santander,7.0,73,la Verneda i la Pau,10,Sant Martí,8020,FP,432882.376561,4.586038e+06,41.423094,2.196790,FP
4,Escola de Música Kostka,Rier Can Toda,29.0,30,la Salut,6,Gràcia,8024,Music School,429568.000936,4.585099e+06,41.414357,2.157240,Music School
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1475,Biblioteca Trinitat Vella - José Barbero,,,57,la Trinitat Vella,9,Sant Andreu,0,Library & Study Room,,,41.449283,2.190749,Library & Study Room
1479,Biblioteca Poblenou - Manuel Arranz,,,68,el Poblenou,10,Sant Martí,0,Library & Study Room,,,41.401373,2.204526,Library & Study Room
1480,Biblioteca Ramon d'Alòs-Moner,,,70,el Besòs i el Maresme,10,Sant Martí,0,Library & Study Room,,,41.416309,2.211483,Library & Study Room
1483,Biblioteca Poble Sec - Francesc Boix,,,11,el Poble Sec,3,Sants-Montjuïc,0,Library & Study Room,,,41.373922,2.164025,Library & Study Room


In [110]:
education_df.to_csv('cleaned_education.csv')
