# Analisis de Egresos Hospitalarios

In [28]:
import importlib

import pandas as pd
import numpy as np
import polars as pl

import matplotlib.pyplot as plt
import seaborn as sns

import lectura_archivos as fr
import calculo_metricas as aux

sns.set_style()
plt.rcParams["figure.figsize"] = (12, 6)

importlib.reload(fr)
importlib.reload(aux)

<module 'calculo_metricas' from 'c:\\Users\\ppizarro\\Desktop\\Javier Rojas\\Javier\\trabajo\\SSMO\\EPH\\modulo_gestion\\1.analisis_problemas_de_salud\\egresos-hospitalarios\\calculo_metricas.py'>

In [29]:
HOSPITAL_A_ANALIZAR = 112103  # Este es el Torax

## Lectura de archivos

- Se leen todos los archivos que estan en input/utf-8. Los archivos estan separados por ;
- Se dejan solamente los egresos de los diagnosticos que **SI** tenga el Tórax
- Se cambia la codificacion de INTERV_Q de 2 (No, 1 es SI) a 0.
- Se cambia la codificacion de CONDICION_EGRESO (orig 1 = Vivo, 2 = Fallecido) de 1 -> 0 y 2 -> 1

In [23]:
df = fr.leer_archivos(HOSPITAL_A_ANALIZAR)


# Analisis de Egresos Hospitalarios

Se calculan las siguientes metricas:

- Número de Egresos (n_egresos)
- Días de Estada promedio (dias_estada_promedio)
- Cantidad de Intervenciones Quirúrgicas (n_int_q)
- Cantidad de Muertes (n_muertos)

Todas estas metricas estan calculadas a nivel de Año, Establecimiento de Salud y Diagnóstico. Por
ejemplo:

***"En el año 2019, el Hospital San José (código XXXXXXX) tuvo XX egresos, con XX dias estada_promedio,
con XX intervenciones_quirúrgicas y XX muertos para el diagnóstico A24.4."***

Este análisis se realizó entre 2001 y 2020 para todos los hospitales/clínicas de Chile.

In [25]:
AGRUPACION = [
        "ANO_EGRESO",
        "ESTABLECIMIENTO_SALUD",
        "GLOSA_ESTABLECIMIENTO_SALUD",
        "DIAG1",
    ]

metricas = aux.obtener_metricas_egresos(df, AGRUPACION).collect(streaming=True)

# Analisis de Estratos

In [30]:
diccionario_estratos = aux.obtener_diccionario_estratos(df, HOSPITAL_A_ANALIZAR)

In [None]:
variables_a_rankear = ["n_egresos"]
subgrupo_del_ranking = ["ANO_EGRESO", "DIAG1"]
unir_tablas_por = agrupacion_anio

In [None]:
def obtener_metricas_para_un_estrato(
    df_estrato, glosa_estrato, variable_analisis, subgrupo_del_ranking
):
    sufijo_cols = f"_{glosa_estrato}_{variable_analisis}"
    var_rank = f"ranking{sufijo_cols}"
    var_porc = f"%{sufijo_cols}"
    var_total = f"total{sufijo_cols}"

    resumen = df_estrato.with_columns(
        (pl.col("DIAG1").cumcount().over(subgrupo_del_ranking) + 1).alias(var_rank),
        (pl.col("n_egresos").sum().over(subgrupo_del_ranking)).alias(var_total),
    )

    resumen = resumen.with_columns((pl.col("n_egresos") / pl.col(var_total)).alias(var_porc))

    return resumen


def obtener_resumen_por_estratos(df, dict_estratos, variables_a_rankear, subgrupo_del_ranking):
    for variable_analisis in variables_a_rankear:
        resultado_estrato = {}
        df = df.sort(subgrupo_del_ranking + [variable_analisis], descending=True)

        for glosa_estrato, codigos_en_estrato in dict_estratos.items():
            if glosa_estrato == "interno":
                subgrupo_del_ranking.remove("DIAG1")

            df_estrato = df.filter(pl.col("ESTABLECIMIENTO_SALUD").is_in(codigos_en_estrato))
            resumen = obtener_metricas_para_un_estrato(
                df_estrato, glosa_estrato, variable_analisis, subgrupo_del_ranking
            )

            resultado_estrato[glosa_estrato] = resumen

    return resultado_estrato

In [None]:
resultados = obtener_resumen_por_estratos(
    metricas, diccionario_estratos, variables_a_rankear, subgrupo_del_ranking
)


In [None]:
from functools import reduce


def left_join_consecutivo(left, right):
    return left.join(right, how="left", on=metricas.columns)

In [None]:
resultado = reduce(left_join_consecutivo, resultados.values())