In [None]:
import pandas as pd
import plotly.express as px
import numpy as np

In [2]:
df_hospitals = pd.read_csv("../data/hospitals_spain.csv")
df_hospitals.columns

Index(['OBJECTID', 'CODCNH', 'NOMBRE', 'DIRECCION', 'TELEFONO', 'TELEFONO2',
       'TELEFAX', 'CODMU', 'MUNICIPIOS', 'CODPROV', 'PROVINCIAS', 'CODAUTO',
       'COMUNIDADES', 'CODPOSTAL', 'NCAMAS', 'CODFI', 'FINALIDAD_ASISITENCIAL',
       'CODPAT', 'DEPENDENCIA_PATRIMONIAL', 'CODFU', 'DEPENDENCIA_FUNCIONAL',
       'ACREDOCENT', 'ESCOMPLE', 'FORCOMPLE', 'CODIDCOM', 'ALTA', 'CERRADO',
       'CAPITAL', 'CIERREFECH', 'CONCIERTO', 'EMAIL', 'TAC', 'RM', 'GAM',
       'HEM', 'ASD', 'LIT', 'BCO', 'ALI', 'SPECT', 'PET', 'MAMOS', 'DO',
       'DIAL', 'X', 'Y', 'CalidadGeocodificacion'],
      dtype='object')

The column names in the hospitals dataset are:

- **Identification**
    - `OBJECTID`: Object identifier
    - `CODCNH`: Hospital code
    - `NOMBRE`: Hospital name
    - `CODIDCOM`: Community identifier code

- **Contact Information**
    - `DIRECCION`: Address
    - `TELEFONO`: Phone
    - `TELEFONO2`: Secondary phone
    - `TELEFAX`: Fax
    - `EMAIL`: Email address
    - `CODPOSTAL`: Postal code

- **Location**
    - `CODMU`: Municipality code
    - `MUNICIPIOS`: Municipality name 
    - `CODPROV`: Province code
    - `PROVINCIAS`: Province name
    - `CODAUTO`: Autonomous community code 
    - `COMUNIDADES`: Autonomous community name
    - `X`: Longitude coordinate
    - `Y`: Latitude coordinate
    - `CalidadGeocodificacion`: Geocoding quality
    - `CAPITAL`: Capital city indicator

- **Hospital Information**
    - `NCAMAS`: Number of beds
    - `CODFI`: Healthcare purpose code
    - `FINALIDAD_ASISITENCIAL`: Healthcare purpose description
    - `CODPAT`: Asset ownership code
    - `DEPENDENCIA_PATRIMONIAL`: Asset ownership description
    - `CODFU`: Functional dependency code
    - `DEPENDENCIA_FUNCIONAL`: Functional dependency description

- **Status & Certifications**
    - `ACREDOCENT`: Teaching accreditation
    - `ESCOMPLE`: Complementary center
    - `FORCOMPLE`: Complementary form
    - `ALTA`: Active status
    - `CERRADO`: Closed status
    - `CIERREFECH`: Closing date
    - `CONCIERTO`: Agreement status

- **Equipment & Services**
    - `TAC`: CT scanner
    - `RM`: MRI
    - `GAM`: Gamma camera
    - `HEM`: Hemodynamics
    - `ASD`: Assistant diagnostic systems
    - `LIT`: Lithotripsy
    - `BCO`: Blood bank
    - `ALI`: Other
    - `SPECT`: SPECT scanner
    - `PET`: PET scanner
    - `MAMOS`: Mammography
    - `DO`: Other diagnostic
    - `DIAL`: Dialysis

In [3]:
hospital_dict = {
    'NOMBRE': 1,
    'CODMU': 1,
    'MUNICIPIOS': 1,
    'CODAUTO': 1,
    'COMUNIDADES': 1,
    'NCAMAS': 1,
    'FINALIDAD_ASISITENCIAL': 1,
    'DEPENDENCIA_PATRIMONIAL': 1,
    'X': 1,
    'Y': 1,
}

In [4]:
is_null = df_hospitals.isnull().sum().sort_values(ascending=False)
is_null

CIERREFECH                 923
CODIDCOM                   809
TELEFONO2                  574
EMAIL                      156
TELEFAX                     66
TELEFONO                     2
LIT                          0
CAPITAL                      0
CONCIERTO                    0
TAC                          0
RM                           0
GAM                          0
HEM                          0
ASD                          0
OBJECTID                     0
BCO                          0
CERRADO                      0
SPECT                        0
PET                          0
MAMOS                        0
DO                           0
DIAL                         0
X                            0
Y                            0
ALI                          0
FORCOMPLE                    0
ALTA                         0
CODPOSTAL                    0
NOMBRE                       0
DIRECCION                    0
CODMU                        0
MUNICIPIOS                   0
CODPROV 