# Analisis de Egresos Hospitalarios

In [1]:
import importlib

import pandas as pd
import numpy as np
import polars as pl

import matplotlib.pyplot as plt
import seaborn as sns

import lectura_archivos as fr
import calculo_metricas as aux

from functools import reduce

sns.set_style()
plt.rcParams["figure.figsize"] = (12, 6)

importlib.reload(fr)
importlib.reload(aux)

<module 'calculo_metricas' from 'c:\\Users\\ppizarro\\Desktop\\Javier Rojas\\Javier\\trabajo\\SSMO\\EPH\\modulo_gestion\\1.analisis_problemas_de_salud\\egresos-hospitalarios\\calculo_metricas.py'>

In [2]:
HOSPITAL_A_ANALIZAR = 112103  # Este es el Torax

## Lectura de archivos

- Se leen todos los archivos que estan en input/utf-8. Los archivos estan separados por ;
- Se dejan solamente los egresos de los diagnosticos que **SI** tenga el Tórax
- Se cambia la codificacion de INTERV_Q de 2 (No, 1 es SI) a 0.
- Se cambia la codificacion de CONDICION_EGRESO (orig 1 = Vivo, 2 = Fallecido) de 1 -> 0 y 2 -> 1
- Se cambia la codificacion de GLOSA_REGION_RESIDENCIA {
                        "Del Libertador B. O'Higgins": "del Libertador General Bernardo O'Higgins",
                        "De Aisén del Gral. C. Ibáñez del Campo": "Aysén del General Carlos Ibáñez del Campo",
                    }

In [3]:
df = fr.leer_archivos(HOSPITAL_A_ANALIZAR)


# Analisis de Egresos Hospitalarios

Se calculan las siguientes metricas:

- Número de Egresos (n_egresos)
- Días de Estada promedio (dias_estada_promedio)
- Cantidad de Intervenciones Quirúrgicas (n_int_q)
- Cantidad de Muertes (n_muertos)

Todas estas metricas estan calculadas a nivel de Año, Establecimiento de Salud y Diagnóstico. Por
ejemplo:

***"En el año 2019, el Hospital San José (código XXXXXXX) tuvo XX egresos, con XX dias estada_promedio,
con XX intervenciones_quirúrgicas y XX muertos para el diagnóstico A24.4."***

Este análisis se realizó entre 2001 y 2020 para todos los hospitales/clínicas de Chile.

In [4]:
AGRUPACION = [
    "ANO_EGRESO",
    "ESTABLECIMIENTO_SALUD",
    "GLOSA_ESTABLECIMIENTO_SALUD",
    "DIAG1",
]

metricas = aux.obtener_metricas_egresos(df, AGRUPACION).collect(streaming=True)

# Analisis de Estratos

In [5]:
variables_a_rankear = ["n_egresos"]
subgrupo_del_ranking = ["ANO_EGRESO", "DIAG1"]
unir_tablas_por = AGRUPACION


In [6]:
dict_estratos = aux.obtener_diccionario_estratos(df, HOSPITAL_A_ANALIZAR)


In [7]:
dict_resultados_estratos = aux.obtener_resumen_por_estratos(
    metricas, dict_estratos, variables_a_rankear, subgrupo_del_ranking
)

resultado = reduce(aux.left_join_consecutivo, dict_resultados_estratos.values())


# Analisis Sociodemográfico

In [16]:
desglose_sociodemografico = [
    "ANO_EGRESO",
    "REGION_RESIDENCIA",
    "GLOSA_REGION_RESIDENCIA",
    "COMUNA_RESIDENCIA",
    "GLOSA_COMUNA_RESIDENCIA",
    "DIAG1",
]

schema_optimo = {
    "ANO_EGRESO": pl.Int32,
    "REGION_RESIDENCIA": pl.Categorical,
    "GLOSA_REGION_RESIDENCIA": pl.Categorical,
    "COMUNA_RESIDENCIA": pl.Categorical,
    "GLOSA_COMUNA_RESIDENCIA": pl.Categorical,
    "DIAG1": pl.Utf8,
}

df_socio = (
    pl.scan_csv("input/utf-8/*.csv", separator=";", dtypes=schema_optimo)
    .filter(pl.col("ESTABLECIMIENTO_SALUD") == 112103)
    .groupby(desglose_sociodemografico)
    .agg(pl.col("DIAG1").count().alias("conteo"))
    .with_columns(
        (("Región " + pl.col("GLOSA_REGION_RESIDENCIA") + ", Chile").alias("region_pais"))
    )
    .with_columns(
        (pl.col("GLOSA_COMUNA_RESIDENCIA") + ", " + pl.col("region_pais")).alias(
            "comuna_region_pais"
        )
    )
    .sort(["ANO_EGRESO", "DIAG1", "conteo"], descending=True)
)

In [17]:
variables_a_analizar = [
    "SEXO",
    "EDAD_CATEGORIA",
    "PUEBLO_ORIGINARIO",
    "GLOSA_PAIS_ORIGEN",
    "PREVISION",
    "BENEFICIARIO",
]

In [18]:
with pl.StringCache():
    resultado_sociodemo = df_socio.collect(streaming=True)


In [19]:
resultado_sociodemo


ANO_EGRESO,REGION_RESIDENCIA,GLOSA_REGION_RESIDENCIA,COMUNA_RESIDENCIA,GLOSA_COMUNA_RESIDENCIA,DIAG1,conteo,region_pais,comuna_region_pais
i32,cat,cat,cat,cat,str,u32,str,str
2020,"""13""","""Metropolitana …","""13114""","""Las Condes""","""Z548""",1,"""Región Metropo…","""Las Condes, Re…"
2020,"""16""","""De Ñuble""","""16101""","""Chillán""","""Z540""",1,"""Región De Ñubl…","""Chillán, Regió…"
2020,"""13""","""Metropolitana …","""13122""","""Peñalolén""","""Z540""",1,"""Región Metropo…","""Peñalolén, Reg…"
2020,"""05""","""De Valparaíso""","""5105""","""Puchuncaví""","""Z540""",1,"""Región De Valp…","""Puchuncaví, Re…"
2020,"""13""","""Metropolitana …","""13126""","""Quinta Normal""","""Z540""",1,"""Región Metropo…","""Quinta Normal,…"
2020,"""13""","""Metropolitana …","""13401""","""San Bernardo""","""Z540""",1,"""Región Metropo…","""San Bernardo, …"
2020,"""13""","""Metropolitana …","""13114""","""Las Condes""","""Z530""",1,"""Región Metropo…","""Las Condes, Re…"
2020,"""05""","""De Valparaíso""","""5101""","""Valparaíso""","""Z518""",3,"""Región De Valp…","""Valparaíso, Re…"
2020,"""13""","""Metropolitana …","""13120""","""Ñuñoa""","""Z518""",3,"""Región Metropo…","""Ñuñoa, Región …"
2020,"""13""","""Metropolitana …","""13115""","""Lo Barnechea""","""Z518""",2,"""Región Metropo…","""Lo Barnechea, …"
