# Aggregations in Resources and Egress patients file

## Libraries

In [1]:
import pandas as pd

In [2]:
pd.set_option('display.max_columns', None)

## Load data

In [3]:
egress_resources = pd.read_csv('../data/egresos_resources.csv')

In [4]:
egress_resources.head(1)

Unnamed: 0,anio,lat_decimal,lon_decimal,personal_medico_nomina,personal_medico_acuerdo,contacto_directo_paciente_nomina,contacto_directo_paciente_acuerdo,medicos_generales_nomina,medicos_generales_acuerdo,especialistas_nomina,especialistas_acuerdo,ginecoobstetras_nomina,ginecoobstetras_acuerdo,pediatras_nomina,pediatras_acuerdo,cirujanos_nomina,cirujanos_acuerdo,internistas_nomina,internistas_acuerdo,anestesiologos_nomina,anestesiologos_acuerdo,otros_especialistas_nomina,otros_especialistas_acuerdo,odontologos_nomina,odontologos_acuerdo,residentes_nomina,residentes_acuerdo,pasantes_nomina,pasantes_acuerdo,medicos_otras_labores_nomina,medicos_otras_labores_acuerdo,personal_no_medico,diagnostico_medico,tratamiento_medico,personal_paramedico,auxiliares_enfermeria,enfermeras_generales,enfermeras_especializadas,pasantes_enfermeria,otras_enfermeras,otro_personal_paramedico,personal_administrativo,otro_personal,consultorios,consultorios_generales,consultorios_especialidad,camas_censables,camas_medicina_interna,camas_cirugia,camas_ginecoobstetricia,camas_pediatria,camas_otras,camas_no_censables,camas_cuidado_intensivo,camas_cuidado_intermedio,camas_no_censables_otras,lab_analisis_clinicos,lab_anatomia_patologica,salas_radiologia,equipos_rayos_x,area_radioterapia,equipos_radioterapia,quirofanos,salas_expulsion,incubadoras,cunas_rn,area_pediatria,area_urgencias,area_aislamiento,resonancia_magnetica,equipo_dialisis,hemodialisis,mamografia,ultrasonido,electrocardiografo,endoscopio,electroencefalografo,litotriptores,tac_scanner,bomba_cobalto,bancos_sangre,uci,uci_adultos,uci_neonatal,unidades_dentales,lat_trunc_res,lon_trunc_res,clues,edad_anios,sexo,servicio_troncal,tipo_derechohabiente,fecha_ingreso,fecha_egreso,diagnostico_principal_cie10,descripcion_diagnostico,clave_institucion,nombre_institucion,clave_entidad_egresos,nombre_entidad,clave_municipio_egresos,nombre_municipio,clave_localidad,nombre_localidad,nombre_unidad,codigo_postal,latitud,longitud,nivel_atencion,lat_trunc,lon_trunc
0,2024,32.641176,-115.475578,40,653,31,645,25,98,6,526,2,59,1,71,1,84,1,30,0,58,1,224,0,1,0,14,0,6,9,8,1310,88,0,601,63,389,43,24,18,64,251,370,42,25,17,232,49,28,31,6,118,119,29,10,80,8,4,8,22,0,0,36,11,45,45,4,22,5,3,0,1,5,21,23,9,4,2,3,0,0,32,20,12,0,32.6,-115.4,BCIST000040,72,hombre,Cirugia General,pensionado,12/01/2024 0:00,19/01/2024 0:00,C61.X,Tumor maligno de la prostata,IST,INSTITUTO DE SEGURIDAD Y SERVICIOS SOCIALES DE...,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,"HG ""5 DE DICIEMBRE"", MEXICALI",21000.0,32.6438,-115.47638,SEGUNDO NIVEL,32.6,-115.4


## Aggregations

In [5]:
combinations = {
    'personal_medico_general': [
        'personal_medico_nomina','personal_medico_acuerdo','contacto_directo_paciente_nomina',
        'contacto_directo_paciente_acuerdo','medicos_generales_nomina','medicos_generales_acuerdo',
        'residentes_nomina','residentes_acuerdo','medicos_otras_labores_nomina',
        'medicos_otras_labores_acuerdo'
    ],
    'personal_medico_esp':[
        'especialistas_nomina','especialistas_acuerdo',
        'otros_especialistas_nomina','otros_especialistas_acuerdo'
    ],
    'ginecoobstetras':['ginecoobstetras_nomina','ginecoobstetras_acuerdo'],
    'pediatras':['pediatras_nomina','pediatras_acuerdo'],
    'cirujanos':['cirujanos_nomina','cirujanos_acuerdo'],
    'internistas':['internistas_nomina','internistas_acuerdo'],
    'anestesiologos':['anestesiologos_nomina','anestesiologos_acuerdo'],
    'odontologos':['odontologos_nomina','odontologos_acuerdo'],
    'pasantes':['pasantes_nomina','pasantes_acuerdo'],
    'personal_hospital':[
        'personal_no_medico','personal_paramedico','otro_personal_paramedico',
        'personal_administrativo','otro_personal'
    ],
    'enfermeras_general':[
        'auxiliares_enfermeria','enfermeras_generales','pasantes_enfermeria',
        'otras_enfermeras'
    ],
    'enfermeras_esp':['enfermeras_especializadas'],
    'atencion_medica':['diagnostico_medico','tratamiento_medico'],
    'consultorios':[
        'consultorios','consultorios_generales','consultorios_especialidad'
    ],
    'camas_hospitalizacion':[
        'camas_censables','camas_medicina_interna','camas_cirugia',
        'camas_ginecoobstetricia','camas_pediatria','camas_otras'
    ],
    'camas_atencion_temporal':[
        'camas_no_censables','camas_cuidado_intensivo',
        'camas_cuidado_intermedio','camas_no_censables_otras'
    ],
    'labs':['lab_analisis_clinicos','lab_anatomia_patologica'],
    'infraestructura_imagenologia': [
        'salas_radiologia', 'equipos_rayos_x', 'resonancia_magnetica', 'mamografia',
        'ultrasonido', 'tac_scanner'
    ],
    'infraestructura_radioterapia': [
        'area_radioterapia', 'equipos_radioterapia', 'bomba_cobalto'
    ],
    'infraestructura_quirurgica_obstetrica': ['quirofanos', 'salas_expulsion'],
    'infraestructura_neonatal_pediatrica': [
        'incubadoras', 'cunas_rn', 'area_pediatria'
    ],
    'infraestructura_uci': ['uci', 'uci_adultos', 'uci_neonatal'],
    'infraestructura_urgencias_aislamiento': ['area_urgencias', 'area_aislamiento'],
    'infraestructura_diagnostico_funcional': [
        'electrocardiografo', 'electroencefalografo', 'endoscopio', 'litotriptores'
    ],
    'infraestructura_dialisis': ['equipo_dialisis', 'hemodialisis'],
    'infraestructura_banco_sangre': ['bancos_sangre'],
    'infraestructura_odontologia': ['unidades_dentales']                   
}

In [6]:
for key, value in combinations.items():
    egress_resources[key] = egress_resources[value].sum(axis=1)
    egress_resources = egress_resources.drop(columns=value)
egress_resources.head(1)

Unnamed: 0,anio,lat_decimal,lon_decimal,lat_trunc_res,lon_trunc_res,clues,edad_anios,sexo,servicio_troncal,tipo_derechohabiente,fecha_ingreso,fecha_egreso,diagnostico_principal_cie10,descripcion_diagnostico,clave_institucion,nombre_institucion,clave_entidad_egresos,nombre_entidad,clave_municipio_egresos,nombre_municipio,clave_localidad,nombre_localidad,nombre_unidad,codigo_postal,latitud,longitud,nivel_atencion,lat_trunc,lon_trunc,personal_medico_general,personal_medico_esp,ginecoobstetras,pediatras,cirujanos,internistas,anestesiologos,odontologos,pasantes,personal_hospital,enfermeras_general,enfermeras_esp,atencion_medica,camas_hospitalizacion,camas_atencion_temporal,labs,infraestructura_imagenologia,infraestructura_radioterapia,infraestructura_quirurgica_obstetrica,infraestructura_neonatal_pediatrica,infraestructura_uci,infraestructura_urgencias_aislamiento,infraestructura_diagnostico_funcional,infraestructura_dialisis,infraestructura_banco_sangre,infraestructura_odontologia
0,2024,32.641176,-115.475578,32.6,-115.4,BCIST000040,72,hombre,Cirugia General,pensionado,12/01/2024 0:00,19/01/2024 0:00,C61.X,Tumor maligno de la prostata,IST,INSTITUTO DE SEGURIDAD Y SERVICIOS SOCIALES DE...,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,"HG ""5 DE DICIEMBRE"", MEXICALI",21000.0,32.6438,-115.47638,SEGUNDO NIVEL,32.6,-115.4,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0


In [7]:
egress_resources.shape

(243562, 55)

### Delete repetitive columns

In [8]:
del_cols =[
    'lat_trunc_res','lon_trunc_res','nombre_unidad','latitud','longitud','clave_institucion',
    'lat_trunc','lon_trunc','nombre_institucion','anio','tipo_derechohabiente'
]
egress_resources = egress_resources.drop(columns=del_cols)
egress_resources.head(1)

Unnamed: 0,lat_decimal,lon_decimal,clues,edad_anios,sexo,servicio_troncal,fecha_ingreso,fecha_egreso,diagnostico_principal_cie10,descripcion_diagnostico,clave_entidad_egresos,nombre_entidad,clave_municipio_egresos,nombre_municipio,clave_localidad,nombre_localidad,codigo_postal,nivel_atencion,personal_medico_general,personal_medico_esp,ginecoobstetras,pediatras,cirujanos,internistas,anestesiologos,odontologos,pasantes,personal_hospital,enfermeras_general,enfermeras_esp,atencion_medica,camas_hospitalizacion,camas_atencion_temporal,labs,infraestructura_imagenologia,infraestructura_radioterapia,infraestructura_quirurgica_obstetrica,infraestructura_neonatal_pediatrica,infraestructura_uci,infraestructura_urgencias_aislamiento,infraestructura_diagnostico_funcional,infraestructura_dialisis,infraestructura_banco_sangre,infraestructura_odontologia
0,32.641176,-115.475578,BCIST000040,72,hombre,Cirugia General,12/01/2024 0:00,19/01/2024 0:00,C61.X,Tumor maligno de la prostata,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0


### Transform columns

In [9]:
egress_resources['edad_anios'].describe()

count    243562.000000
mean         52.655817
std          22.820959
min           0.000000
25%          37.000000
50%          57.000000
75%          70.000000
max         120.000000
Name: edad_anios, dtype: float64

In [None]:
bins = [0, 1, 5, 12, 18, 30, 45, 60, 75, 90, 150]
labels = [
    'Menor de 1 año',
    '1 a 4 años',
    '5 a 11 años',
    '12 a 17 años',
    '18 a 29 años',
    '30 a 44 años',
    '45 a 59 años',
    '60 a 74 años',
    '75 a 89 años',
    
    '90 años o más'
]
egress_resources['edad_categoria'] = pd.cut(
    egress_resources['edad_anios'],
    bins=bins,
    labels=labels,
    right=False  # Para que los intervalos sean cerrados a la izquierda y abiertos a la derecha
)
egress_resources.head()

Unnamed: 0,lat_decimal,lon_decimal,clues,edad_anios,sexo,servicio_troncal,fecha_ingreso,fecha_egreso,diagnostico_principal_cie10,descripcion_diagnostico,clave_entidad_egresos,nombre_entidad,clave_municipio_egresos,nombre_municipio,clave_localidad,nombre_localidad,codigo_postal,nivel_atencion,personal_medico_general,personal_medico_esp,ginecoobstetras,pediatras,cirujanos,internistas,anestesiologos,odontologos,pasantes,personal_hospital,enfermeras_general,enfermeras_esp,atencion_medica,camas_hospitalizacion,camas_atencion_temporal,labs,infraestructura_imagenologia,infraestructura_radioterapia,infraestructura_quirurgica_obstetrica,infraestructura_neonatal_pediatrica,infraestructura_uci,infraestructura_urgencias_aislamiento,infraestructura_diagnostico_funcional,infraestructura_dialisis,infraestructura_banco_sangre,infraestructura_odontologia,edad_categoria
0,32.641176,-115.475578,BCIST000040,72,hombre,Cirugia General,12/01/2024 0:00,19/01/2024 0:00,C61.X,Tumor maligno de la prostata,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,60 a 74 años
1,32.641176,-115.475578,BCIST000040,73,mujer,Cirugia General,15/01/2024 0:00,22/01/2024 0:00,M17.9,Gonartrosis no especificada,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,60 a 74 años
2,32.641176,-115.475578,BCIST000040,81,mujer,Gineco-Obstetricia,22/01/2024 0:00,22/01/2024 0:00,N95.0,Hemorragia postmenopausica,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,75 a 89 años
3,32.641176,-115.475578,BCIST000040,82,hombre,Medicina Interna,15/02/2024 0:00,16/02/2024 0:00,I50.1,Insuficiencia ventricular izquierda,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,75 a 89 años
4,32.641176,-115.475578,BCIST000040,74,mujer,Cirugia General,8/02/2024 0:00,9/02/2024 0:00,C50.9,Tumor maligno de la mama parte no especificada,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,60 a 74 años


In [11]:
egress_resources.drop(columns=['edad_anios'], inplace=True)

In [12]:
egress_resources['fecha_ingreso'] = pd.to_datetime(egress_resources['fecha_ingreso'], format='%d/%m/%Y %H:%M')
egress_resources['fecha_egreso'] = pd.to_datetime(egress_resources['fecha_egreso'], format='%d/%m/%Y %H:%M')
egress_resources['year_ingreso'] = egress_resources['fecha_ingreso'].dt.year
egress_resources['mes_ingreso'] = egress_resources['fecha_ingreso'].dt.month
egress_resources['dia_sem_ingreso'] = egress_resources['fecha_ingreso'].dt.dayofweek
egress_resources['hora_ingreso'] = egress_resources['fecha_ingreso'].dt.hour
egress_resources['minutos_ingreso'] = egress_resources['fecha_ingreso'].dt.minute
egress_resources['year_egreso'] = egress_resources['fecha_egreso'].dt.year
egress_resources['mes_egreso'] = egress_resources['fecha_egreso'].dt.month
egress_resources['dia_sem_egreso'] = egress_resources['fecha_egreso'].dt.dayofweek
egress_resources['hora_egreso'] = egress_resources['fecha_egreso'].dt.hour
egress_resources['minutos_egreso'] = egress_resources['fecha_egreso'].dt.minute
egress_resources['ingreso_fecha'] = egress_resources['fecha_ingreso'].dt.date
egress_resources['egreso_fecha'] = egress_resources['fecha_egreso'].dt.date
egress_resources.head()



Unnamed: 0,lat_decimal,lon_decimal,clues,sexo,servicio_troncal,fecha_ingreso,fecha_egreso,diagnostico_principal_cie10,descripcion_diagnostico,clave_entidad_egresos,nombre_entidad,clave_municipio_egresos,nombre_municipio,clave_localidad,nombre_localidad,codigo_postal,nivel_atencion,personal_medico_general,personal_medico_esp,ginecoobstetras,pediatras,cirujanos,internistas,anestesiologos,odontologos,pasantes,personal_hospital,enfermeras_general,enfermeras_esp,atencion_medica,camas_hospitalizacion,camas_atencion_temporal,labs,infraestructura_imagenologia,infraestructura_radioterapia,infraestructura_quirurgica_obstetrica,infraestructura_neonatal_pediatrica,infraestructura_uci,infraestructura_urgencias_aislamiento,infraestructura_diagnostico_funcional,infraestructura_dialisis,infraestructura_banco_sangre,infraestructura_odontologia,edad_categoria,year_ingreso,mes_ingreso,dia_sem_ingreso,hora_ingreso,minutos_ingreso,year_egreso,mes_egreso,dia_sem_egreso,hora_egreso,minutos_egreso,ingreso_fecha,egreso_fecha
0,32.641176,-115.475578,BCIST000040,hombre,Cirugia General,2024-01-12,2024-01-19,C61.X,Tumor maligno de la prostata,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,60 a 74 años,2024,1,4,0,0,2024,1,4,0,0,2024-01-12,2024-01-19
1,32.641176,-115.475578,BCIST000040,mujer,Cirugia General,2024-01-15,2024-01-22,M17.9,Gonartrosis no especificada,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,60 a 74 años,2024,1,0,0,0,2024,1,0,0,0,2024-01-15,2024-01-22
2,32.641176,-115.475578,BCIST000040,mujer,Gineco-Obstetricia,2024-01-22,2024-01-22,N95.0,Hemorragia postmenopausica,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,75 a 89 años,2024,1,0,0,0,2024,1,0,0,0,2024-01-22,2024-01-22
3,32.641176,-115.475578,BCIST000040,hombre,Medicina Interna,2024-02-15,2024-02-16,I50.1,Insuficiencia ventricular izquierda,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,75 a 89 años,2024,2,3,0,0,2024,2,4,0,0,2024-02-15,2024-02-16
4,32.641176,-115.475578,BCIST000040,mujer,Cirugia General,2024-02-08,2024-02-09,C50.9,Tumor maligno de la mama parte no especificada,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,60 a 74 años,2024,2,3,0,0,2024,2,4,0,0,2024-02-08,2024-02-09


In [13]:
print(egress_resources['hora_ingreso'].unique(), egress_resources['hora_egreso'].unique())
print(egress_resources['minutos_ingreso'].unique(), egress_resources['minutos_egreso'].unique())

[0] [0]
[0] [0]


In [14]:
time_del_cols = [
    'hora_ingreso','minutos_ingreso','fecha_ingreso',
    'hora_egreso','minutos_egreso','fecha_egreso'
]
egress_resources.drop(columns=time_del_cols, inplace=True)
egress_resources.head()

Unnamed: 0,lat_decimal,lon_decimal,clues,sexo,servicio_troncal,diagnostico_principal_cie10,descripcion_diagnostico,clave_entidad_egresos,nombre_entidad,clave_municipio_egresos,nombre_municipio,clave_localidad,nombre_localidad,codigo_postal,nivel_atencion,personal_medico_general,personal_medico_esp,ginecoobstetras,pediatras,cirujanos,internistas,anestesiologos,odontologos,pasantes,personal_hospital,enfermeras_general,enfermeras_esp,atencion_medica,camas_hospitalizacion,camas_atencion_temporal,labs,infraestructura_imagenologia,infraestructura_radioterapia,infraestructura_quirurgica_obstetrica,infraestructura_neonatal_pediatrica,infraestructura_uci,infraestructura_urgencias_aislamiento,infraestructura_diagnostico_funcional,infraestructura_dialisis,infraestructura_banco_sangre,infraestructura_odontologia,edad_categoria,year_ingreso,mes_ingreso,dia_sem_ingreso,year_egreso,mes_egreso,dia_sem_egreso,ingreso_fecha,egreso_fecha
0,32.641176,-115.475578,BCIST000040,hombre,Cirugia General,C61.X,Tumor maligno de la prostata,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,60 a 74 años,2024,1,4,2024,1,4,2024-01-12,2024-01-19
1,32.641176,-115.475578,BCIST000040,mujer,Cirugia General,M17.9,Gonartrosis no especificada,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,60 a 74 años,2024,1,0,2024,1,0,2024-01-15,2024-01-22
2,32.641176,-115.475578,BCIST000040,mujer,Gineco-Obstetricia,N95.0,Hemorragia postmenopausica,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,75 a 89 años,2024,1,0,2024,1,0,2024-01-22,2024-01-22
3,32.641176,-115.475578,BCIST000040,hombre,Medicina Interna,I50.1,Insuficiencia ventricular izquierda,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,75 a 89 años,2024,2,3,2024,2,4,2024-02-15,2024-02-16
4,32.641176,-115.475578,BCIST000040,mujer,Cirugia General,C50.9,Tumor maligno de la mama parte no especificada,2,BAJA CALIFORNIA,2,MEXICALI,1,MEXICALI,21000.0,SEGUNDO NIVEL,1523,757,61,72,85,31,58,1,6,2596,494,43,88,464,238,12,62,0,47,94,64,27,38,1,0,0,60 a 74 años,2024,2,3,2024,2,4,2024-02-08,2024-02-09


### Group by

In [15]:
col_combs = [
    'lat_decimal','lon_decimal','clues','servicio_troncal','sexo','ingreso_fecha','egreso_fecha',
    'diagnostico_principal_cie10','descripcion_diagnostico',
    'clave_entidad_egresos','nombre_entidad','clave_municipio_egresos','nombre_municipio',
    'clave_localidad','nombre_localidad','codigo_postal','nivel_atencion',
    'edad_categoria','year_ingreso','mes_ingreso','dia_sem_ingreso',
    'year_egreso','mes_egreso','dia_sem_egreso'
]
egress_resources[col_combs].duplicated().sum()

np.int64(2809)

In [16]:
len(egress_resources)

243562

In [17]:
out_cols = [
    'personal_medico_general','personal_medico_esp','ginecoobstetras',
    'pediatras','cirujanos','internistas','anestesiologos','odontologos',
    'pasantes','personal_hospital','enfermeras_general','enfermeras_esp',
    'atencion_medica','camas_hospitalizacion','camas_atencion_temporal','labs',
    'infraestructura_imagenologia','infraestructura_radioterapia','infraestructura_quirurgica_obstetrica',
    'infraestructura_neonatal_pediatrica','infraestructura_uci','infraestructura_urgencias_aislamiento',
    'infraestructura_diagnostico_funcional','infraestructura_dialisis','infraestructura_banco_sangre',
    'infraestructura_odontologia'
]

In [18]:
final_source = egress_resources.groupby(col_combs, observed=True)[out_cols].agg('sum').reset_index()
final_source.head()

Unnamed: 0,lat_decimal,lon_decimal,clues,servicio_troncal,sexo,ingreso_fecha,egreso_fecha,diagnostico_principal_cie10,descripcion_diagnostico,clave_entidad_egresos,nombre_entidad,clave_municipio_egresos,nombre_municipio,clave_localidad,nombre_localidad,codigo_postal,nivel_atencion,edad_categoria,year_ingreso,mes_ingreso,dia_sem_ingreso,year_egreso,mes_egreso,dia_sem_egreso,personal_medico_general,personal_medico_esp,ginecoobstetras,pediatras,cirujanos,internistas,anestesiologos,odontologos,pasantes,personal_hospital,enfermeras_general,enfermeras_esp,atencion_medica,camas_hospitalizacion,camas_atencion_temporal,labs,infraestructura_imagenologia,infraestructura_radioterapia,infraestructura_quirurgica_obstetrica,infraestructura_neonatal_pediatrica,infraestructura_uci,infraestructura_urgencias_aislamiento,infraestructura_diagnostico_funcional,infraestructura_dialisis,infraestructura_banco_sangre,infraestructura_odontologia
0,16.252461,-92.135835,CSIST000065,Cirugia General,hombre,2024-02-10,2024-02-12,C61.X,Tumor maligno de la prostata,7,CHIAPAS,19,COMITAN DE DOMINGUEZ,1,COMITAN DE DOMINGUEZ,30090.0,SEGUNDO NIVEL,60 a 74 años,2024,2,5,2024,2,0,300,115,21,13,12,7,16,0,0,292,77,4,6,158,14,6,9,0,14,29,0,3,3,0,0,0
1,16.252461,-92.135835,CSIST000065,Cirugia General,hombre,2024-02-21,2024-02-22,E14.5,Diabetes mellitus no especificada con complica...,7,CHIAPAS,19,COMITAN DE DOMINGUEZ,1,COMITAN DE DOMINGUEZ,30090.0,SEGUNDO NIVEL,45 a 59 años,2024,2,2,2024,2,3,300,115,21,13,12,7,16,0,0,292,77,4,6,158,14,6,9,0,14,29,0,3,3,0,0,0
2,16.252461,-92.135835,CSIST000065,Cirugia General,hombre,2024-03-09,2024-03-13,K61.0,Absceso anal,7,CHIAPAS,19,COMITAN DE DOMINGUEZ,1,COMITAN DE DOMINGUEZ,30090.0,SEGUNDO NIVEL,18 a 29 años,2024,3,5,2024,3,2,300,115,21,13,12,7,16,0,0,292,77,4,6,158,14,6,9,0,14,29,0,3,3,0,0,0
3,16.252461,-92.135835,CSIST000065,Cirugia General,hombre,2024-03-10,2024-03-14,S43.1,Luxacion de la articulacion acromioclavicular,7,CHIAPAS,19,COMITAN DE DOMINGUEZ,1,COMITAN DE DOMINGUEZ,30090.0,SEGUNDO NIVEL,45 a 59 años,2024,3,6,2024,3,3,300,115,21,13,12,7,16,0,0,292,77,4,6,158,14,6,9,0,14,29,0,3,3,0,0,0
4,16.252461,-92.135835,CSIST000065,Cirugia General,hombre,2024-03-19,2024-03-21,S43.1,Luxacion de la articulacion acromioclavicular,7,CHIAPAS,19,COMITAN DE DOMINGUEZ,1,COMITAN DE DOMINGUEZ,30090.0,SEGUNDO NIVEL,45 a 59 años,2024,3,1,2024,3,3,300,115,21,13,12,7,16,0,0,292,77,4,6,158,14,6,9,0,14,29,0,3,3,0,0,0


### Output

In [19]:
final_source.to_csv('../data/final_egres_res.csv', index=False)

## Review

In [20]:
final_source.describe()

Unnamed: 0,lat_decimal,lon_decimal,clave_entidad_egresos,clave_municipio_egresos,clave_localidad,codigo_postal,year_ingreso,mes_ingreso,dia_sem_ingreso,year_egreso,mes_egreso,dia_sem_egreso,personal_medico_general,personal_medico_esp,ginecoobstetras,pediatras,cirujanos,internistas,anestesiologos,odontologos,pasantes,personal_hospital,enfermeras_general,enfermeras_esp,atencion_medica,camas_hospitalizacion,camas_atencion_temporal,labs,infraestructura_imagenologia,infraestructura_radioterapia,infraestructura_quirurgica_obstetrica,infraestructura_neonatal_pediatrica,infraestructura_uci,infraestructura_urgencias_aislamiento,infraestructura_diagnostico_funcional,infraestructura_dialisis,infraestructura_banco_sangre,infraestructura_odontologia
count,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0,240753.0
mean,20.725138,-99.534115,15.103396,49.715792,1.964138,46394.731663,2023.989728,6.514415,2.651597,2024.0,6.55974,2.714487,1991.673059,1046.245978,115.986384,84.6121,115.578913,49.057956,135.316233,4.63016,17.348723,2615.131147,482.735364,109.392672,79.735044,652.598165,229.172388,7.321437,53.806495,1.818694,55.070471,117.315842,35.319178,30.278779,32.78338,8.867906,1.931851,1.833958
std,3.045082,4.126855,8.293658,54.581275,5.428007,34366.620318,0.100829,3.406397,1.918194,0.0,3.403763,1.779937,3083.485247,1961.359052,274.517957,175.490806,208.532409,106.027114,240.542095,4.89108,34.388484,2428.731747,441.913082,146.948445,79.179054,511.103756,220.002585,5.627938,37.738057,3.295753,39.81736,91.231786,34.908787,25.835618,27.349988,11.283982,2.310297,2.439782
min,16.252461,-115.475578,2.0,1.0,1.0,1030.0,2023.0,1.0,0.0,2024.0,1.0,0.0,12.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,28.0,2.0,0.0,0.0,12.0,0.0,0.0,1.0,0.0,2.0,3.0,0.0,0.0,0.0,0.0,0.0,0.0
25%,19.359004,-100.999721,9.0,10.0,1.0,9220.0,2024.0,4.0,1.0,2024.0,4.0,1.0,518.0,242.0,28.0,22.0,24.0,11.0,15.0,1.0,0.0,761.0,126.0,7.0,17.0,288.0,84.0,3.0,29.0,0.0,25.0,44.0,6.0,12.0,13.0,0.0,0.0,0.0
50%,19.482945,-99.157853,12.0,28.0,1.0,40000.0,2024.0,7.0,2.0,2024.0,7.0,3.0,1385.0,581.0,49.0,55.0,74.0,31.0,58.0,2.0,4.0,2555.0,347.0,75.0,47.0,550.0,170.0,6.0,50.0,0.0,50.0,97.0,24.0,30.0,32.0,7.0,1.0,1.0
75%,20.967537,-98.197494,21.0,87.0,1.0,78340.0,2024.0,9.0,4.0,2024.0,10.0,4.0,3395.0,1742.0,126.0,70.0,126.0,48.0,186.0,7.0,21.0,4071.0,765.0,130.0,149.0,938.0,344.0,9.0,71.0,2.0,84.0,172.0,56.0,41.0,45.0,12.0,3.0,3.0
max,32.641176,-86.82481,32.0,482.0,38.0,99999.0,2024.0,12.0,6.0,2024.0,12.0,6.0,68702.0,44334.0,6348.0,3910.0,4128.0,1898.0,4394.0,180.0,728.0,52512.0,10380.0,2215.0,1200.0,8088.0,5448.0,84.0,744.0,50.0,612.0,1692.0,672.0,492.0,472.0,160.0,60.0,48.0
