# Análisis Exploratorio de Datos - Redes de Salud

Este notebook tiene como objetivo explorar una base de datos que contiene las redes de salud en Chile `.csv`, preparar los datos y generar un dataset para análisis posteriores.

## Importar librerias
Inicialmente importamos las librerias necesarias para el funcionamiento del notebook.

In [1]:
import pandas as pd

## Lectura archivo: Redes de Salud
Se lee el archivo de redes de salud utilizando pandas.<br>
El listado de los distintos establecimientos de salud se obtiene desde el siguiente [enlace](https://deis.minsal.cl/#datosabiertos), datos abiertos, listado de establecimientos de salud.


In [2]:
# Ruta al archivo
ruta = '../data/raw_data/raw_establecimientos_salud.xlsx'

# Leer el CSV
df_redes_salud = pd.read_excel(ruta, engine="openpyxl", header=1)

# Ver las primeras filas
df_redes_salud.head()

Unnamed: 0,Código Antiguo,Código Vigente,Código Madre Antiguo,Código Madre Nuevo,Código Región,Nombre Región,Código Dependencia Jerárquica (SEREMI / Servicio de Salud),Nombre Dependencia Jerárquica (SEREMI / Servicio de Salud),Pertenencia al SNSS,Tipo Establecimiento (Unidad),...,Tiene Servicio de Urgencia,Tipo de Urgencia,Clasificación Tipo de SAPU,LATITUD [Grados decimales],LONGITUD [Grados decimales],Tipo de Prestador Sistema de Salud,Estado de Funcionamiento,Nivel de Complejidad,Tipo de Atención,Fecha de Incorporación a la base
0,26-704,126704,,,12,Región de Magallanes y de la Antártica Chilena,26,Servicio de Salud Magallanes,Perteneciente al Sistema Nacional de Servicios...,Hospital,...,SI,Urgencia Hospitalaria (UEH),No Aplica,-54.93521,-67.60039,Público,Vigente en operación habitual,Baja Complejidad,Atención Cerrada-Hospitalaria,
1,26-204,126204,,,12,Región de Magallanes y de la Antártica Chilena,12,SEREMI de Magallanes y la Antártica Chilena,No perteneciente al Sistema Nacional de Servic...,Hospital,...,SI,Urgencia Hospitalaria (UEH),No Aplica,-54.934374,-67.608895,Fuerzas Armadas y de Orden,Vigente en operación habitual,Mediana Complejidad,Atención Cerrada-Hospitalaria,2022-10-07 00:00:00
2,26-412,126412,,,12,Región de Magallanes y de la Antártica Chilena,26,Servicio de Salud Magallanes,Perteneciente al Sistema Nacional de Servicios...,Posta de Salud Rural (PSR),...,NO,No Aplica,No Aplica,-53.64055,-69.64585,Público,Vigente en operación habitual,Baja Complejidad,Atención Abierta-Ambulatoria,
3,26-414,126414,,,12,Región de Magallanes y de la Antártica Chilena,26,Servicio de Salud Magallanes,Perteneciente al Sistema Nacional de Servicios...,Posta de Salud Rural (PSR),...,NO,No Aplica,No Aplica,-53.40424,-70.99016,Público,Vigente en operación habitual,Baja Complejidad,Atención Abierta-Ambulatoria,
4,26-102,126102,,,12,Región de Magallanes y de la Antártica Chilena,26,Servicio de Salud Magallanes,Perteneciente al Sistema Nacional de Servicios...,Hospital,...,SI,Urgencia Hospitalaria (UEH),No Aplica,-53.29816,-70.35838,Público,Vigente en operación habitual,Baja Complejidad,Atención Cerrada-Hospitalaria,


## Limpieza de dataset
Debemos observar en primera instancia las columnas que contiene el dataset.

In [3]:
# obtencion nombre columnas
for col in df_redes_salud.columns:
    print(col)


Código Antiguo 
Código Vigente
Código  Madre Antiguo
Código Madre Nuevo
Código Región
Nombre Región
Código Dependencia Jerárquica (SEREMI / Servicio de Salud)
Nombre Dependencia Jerárquica (SEREMI / Servicio de Salud)
Pertenencia al SNSS
Tipo Establecimiento (Unidad)
Ámbito de Funcionamiento
Nombre Oficial
Certificación 
Dependencia Administrativa
Nivel de Atención
Código Comuna
Nombre Comuna
Vía
Número
Dirección
Teléfono
Fecha Inicio Funcionamiento
Tiene Servicio de Urgencia
Tipo de Urgencia 
Clasificación Tipo de SAPU
LATITUD [Grados decimales]
LONGITUD [Grados decimales]
Tipo de Prestador Sistema de Salud
Estado de Funcionamiento
Nivel de Complejidad
Tipo de Atención 
Fecha de Incorporación a la base 


## Seleccionar columnas y exportacion a csv
Se seleccionan las columnas de interes para el estudio, luego se exportara a formato csv para ser utilizado.

In [4]:
# Seleccionar columnas de interes
selected_cols = ["Código Región",
                 "Nombre Región",
                 "Pertenencia al SNSS",
                 "Tipo Establecimiento (Unidad)",
                 "Ámbito de Funcionamiento",
                 "Nombre Oficial",
                 "Dependencia Administrativa",
                 "Nivel de Atención",
                 "Código Comuna",
                 "Nombre Comuna",
                 "Tiene Servicio de Urgencia",
                 "Tipo de Urgencia ",
                 "Clasificación Tipo de SAPU",
                 "LATITUD [Grados decimales]",
                 "LONGITUD [Grados decimales]",
                 "Tipo de Prestador Sistema de Salud",
                 "Estado de Funcionamiento",
                 "Nivel de Complejidad",
                 "Tipo de Atención "]

# seleccionamos las columnas del dataframe
df_redes_salud = df_redes_salud[selected_cols]

# Guardar como CSV
df_redes_salud.to_csv('../data/processed_data/red_hospitalaria.csv', index=False)

## Seleccion Red de salud Publica
Tambien crearemos un dataset que contenga la informacion correspondiente a la red publica de salud, observando el tipo de establecimiento que lo componen.

In [5]:
# Seleccionamos las pertenecientes al sistema publico.
df_redes_salud_publico = df_redes_salud[df_redes_salud["Tipo de Prestador Sistema de Salud"] == "Público "]

# Observamos los tipos de establecimientos publicos de la red
for tipo in df_redes_salud_publico["Tipo Establecimiento (Unidad)"].unique():
    print(tipo)

Hospital
Posta de Salud Rural (PSR)
Centro Comunitario de Salud Familiar (CECOSF)
Centro Comunitario de Salud Mental  (COSAM)
Servicio de Atención Primaria de Urgencia de Alta Resolutividad (SAR)
Centro de Salud Familiar (CESFAM)
Laboratorio Clínico
Unidad de Salud Funcionarios 
Dirección Servicio de Salud
Programa de Reparación y Atención Integral de Salud (PRAIS)
Servicio de Atención Primaria de Urgencia (SAPU)
Consultorio General Urbano  (CGU)
Unidad de Procedimientos Móvil 
Servicio de Urgencia Rural (SUR)
Clínica Dental
Centros de Diagnóstico Terapéutico (CDT)
Hospital de Día Infanto Adolescente
Consultorio General Rural (CGR)
Centro de Rehabilitación
Centro de Referencia de Salud (CRS)
Centro de Apoyo Comunitario para personas con Demencia
Centro de Salud Mental
Centro de Tratamiento de Adicciones (CTA)
Hospital de Dia Adulto
Puesto de Atención Médica Especializado (PAME) Incorporado por Crisis Sanitaria
Dispositivo Incorporado por Crisis Sanitaria
Centro de Especialidad
Centro d

## Seleccion de tipos de centros de salud publico de interes
Para esta seleccion se consideraron los centros de salud que presten servicios de atencion primaria secundaria y terciaria.

In [6]:
# Lista de centros a considerar
centros = [
    'Centro de Salud Familiar (CESFAM)',
    'Servicio de Urgencia Rural (SUR)',
    'Posta de Salud Rural (PSR)',
    'Centro Comunitario de Salud Familiar (CECOSF)',
    'Servicio de Atención Primaria de Urgencia (SAPU)',
    'Hospital'
]

df_redes_salud_publico = df_redes_salud_publico[df_redes_salud_publico['Tipo Establecimiento (Unidad)'].isin(centros)]

## Creacion DataFrame con cantidad de centros de salud
Se crea a continuacion un nuevo DataFrame que contiene la informacion de la cantidad de centros de salud por comuna.


In [7]:
# Agrupar por comuna y contar cantidad de centros
conteo_por_comuna = (
    df_redes_salud_publico.groupby(['Código Comuna','Nombre Comuna'])['Tipo Establecimiento (Unidad)']
    .value_counts()
    .unstack(fill_value=0)  # cambia nan por 0
    .reset_index()
)

conteo_por_comuna.columns.name = None
conteo_por_comuna['Código Comuna'] = conteo_por_comuna['Código Comuna'].astype(int)

# Agregar total de centros por comuna
conteo_por_comuna['Total_centros'] = conteo_por_comuna[centros].sum(axis=1)

centros_publicos= conteo_por_comuna[['Código Comuna','Nombre Comuna','Total_centros']]
print(centros_publicos.shape)
centros_publicos.head()

(346, 3)


Unnamed: 0,Código Comuna,Nombre Comuna,Total_centros
0,1101,Iquique,12
1,1107,Alto Hospicio,8
2,1401,Pozo Almonte,5
3,1402,Camiña,3
4,1403,Colchane,5


In [10]:
duplicados = centros_publicos[centros_publicos.duplicated(subset=['Código Comuna'], keep=False)]

print(duplicados)

Empty DataFrame
Columns: [Código Comuna, Nombre Comuna, Total_centros]
Index: []


In [9]:
# Agrupamos por código
df_final = centros_publicos.groupby('Código Comuna', as_index=False).agg({
    'Nombre Comuna': 'last',
    'Total_centros': 'sum'
})

## Exportacion a CSV red publica
Finalmente exportamos a un csv la informacion correspondiente a la cantidad de centros de salud publicos por comuna que utilizaremos en nuestro estudio.

In [13]:
df_final.to_csv("../data/processed_data/red_hospitalaria_publica.csv", index=False)

# Analisis inicial Red Hospitalaria
Con la informacion obtenida podemos hacer un analisis inicial que indique las cantidades que componen la Red, por cada region y segun el tipo de prestador del sistema de salud.

In [18]:
df_redes_salud["Tipo de Prestador Sistema de Salud"] = df_redes_salud["Tipo de Prestador Sistema de Salud"].str.strip()

resumen = df_redes_salud.groupby(["Nombre Región", "Tipo de Prestador Sistema de Salud"]).size().reset_index(name="Cantidad")

resumen_pivot = resumen.pivot(index="Nombre Región",
                               columns="Tipo de Prestador Sistema de Salud",
                               values="Cantidad").fillna(0).astype(int)

resumen_pivot.head(20)

Tipo de Prestador Sistema de Salud,Fuerzas Armadas y de Orden,Pendiente,Privado,Público
Nombre Región,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
Región Metropolitana de Santiago,21,5,487,530
Región de Antofagasta,4,0,103,64
Región de Arica Parinacota,5,0,81,35
Región de Atacama,3,0,89,61
Región de Aysén del General Carlos Ibañez del Campo,2,0,12,48
Región de Coquimbo,4,0,298,184
Región de La Araucanía,5,2,107,335
Región de Los Lagos,8,0,91,333
Región de Los Ríos,5,1,58,137
Región de Magallanes y de la Antártica Chilena,5,0,22,31
