# Indicadores de Trazabilidad 



## Importación de datos, librerias

In [1]:
# Importa librerias necesarias para el análisis

import pandas as pd
import numpy as np
import plotly.express as px

In [2]:
# Importa datos de población regional y crea DF


df_poblacion = pd.read_csv('data/aysen_population.csv') #Archivo ubicado dentro de la carpeta data

df_poblacion.head(2)

Unnamed: 0.1,Unnamed: 0,orden,nombre_region,codigo_region,nombre_provincia,codigo_provincia,nombre_comuna,codigo_comuna,edad_hombres,edad_mujeres,total
0,0,7172,Región de Aysén del General Carlos Ibáñez del ...,11,Coyhaique,111,Coyhaique,11101,28763,29055,57818
1,1,7194,Región de Aysén del General Carlos Ibáñez del ...,11,Coyhaique,111,Lago Verde,11102,494,358,852


In [3]:
# Importa datos de comunas corregidas por establecimiento de salud

df_establecimiento = pd.read_excel('data/establecimientos_salud_dict.xlsx') #Archivo ubicado dentro de la carpeta data


df_establecimiento.head()

Unnamed: 0,establecimiento_salud,comuna_seremi_xi,provincia_seremi_xi
0,Actividades gestionadas por la Dirección del S...,Coyhaique,Coyhaique
1,Centro Clínico Militar Coyhaique,Coyhaique,Coyhaique
2,Centro Comunitario de Salud Familiar Villa Ma...,Aysen,Aysen
3,Centro Comunitario de Salud Familiar Alejandro...,Coyhaique,Coyhaique
4,Centro Comunitario de Salud Familiar Puerto Ch...,Aysen,Aysen


In [4]:
# Importa datos desde la base de datos recivida via FTP
## PRIMERO: Guardar archivo dentro de la carpeta data
## SEGUNDO: No cambiar nombre ni formato del archivo recibido
## TERCERO: RECORDAR CAMBIAR FECHA EN EL ARCHIVO A IMPORTAR A CONTINUACION, i.e: 20210829 para este domingo 29 de Agosto 2021

df =  pd.read_csv('data/20210905_Región de Aysén del General Carlos Ibáñez del Campo_notificaciones_0600.csv', 
                   sep='~', # CSV con separador ''~''
                   low_memory=False
                  )

In [5]:
df_trazabilidad =  pd.read_csv('data/20210905_Región de Aysén del General Carlos Ibáñez del Campo_Seguimiento.csv', 
                   sep=';', # CSV con separador ''~''
                   low_memory=False
                  )

##  limpieza y ordenamiento 

In [6]:
# Une datos con diccionario comunal

dff = df.merge(df_establecimiento, how='left')

In [7]:
# Integra datos poblacionales

df_merged = dff.merge(df_poblacion.drop(columns= ['Unnamed: 0','orden','nombre_region', 'codigo_region', 'nombre_provincia','codigo_provincia']), left_on='comuna_seremi_xi', right_on='nombre_comuna', how='left' )

In [8]:
# Filtra datos obtenidos solo para pacientes con residencia en la Región de Aysén

data_aysen = df_merged[df_merged['region_residencia'] == 'Región de Aysén del General Carlos Ibáñez del Campo']

data_aysen.head(1)

Unnamed: 0,id_formulario_eno,numero_folio,id_enfermedad_eno,enfermedad_notificada,semana_epidemiologica,fecha_notificacion,etapa_clinica,establecimiento_salud,region,seremi,...,tac_torax_covid,condicion,region_separacion,comuna_seremi_xi,provincia_seremi_xi,nombre_comuna,codigo_comuna,edad_hombres,edad_mujeres,total
0,100166,50166,50,Coronavirus (COVID-19),11,2020-03-12,DESCARTADA,Hospital Regional (Coihaique),Región de Aysén del General Carlos Ibáñez del ...,SEREMI De Aisén del General Carlos Ibañez del ...,...,,,Región de Aysén del General Carlos Ibáñez del ...,Coyhaique,Coyhaique,Coyhaique,11101.0,28763.0,29055.0,57818.0


In [9]:
data_aysen_filtered = data_aysen[(data_aysen['estado_caso']!='No validada')&(
                          data_aysen['vigente_no_eliminado']==True)&(
                          data_aysen['seremi']=='SEREMI De Aisén del General Carlos Ibañez del Campo')
                       ].rename(columns={'edad_hombres':'pop_hombres',
                                         'edad_mujeres':'pop_mujeres',
                                         'total':'pop_total'})

data_aysen_filtered.sample(1)

Unnamed: 0,id_formulario_eno,numero_folio,id_enfermedad_eno,enfermedad_notificada,semana_epidemiologica,fecha_notificacion,etapa_clinica,establecimiento_salud,region,seremi,...,tac_torax_covid,condicion,region_separacion,comuna_seremi_xi,provincia_seremi_xi,nombre_comuna,codigo_comuna,pop_hombres,pop_mujeres,pop_total
58762,8005496,7955496,50,Coronavirus (COVID-19),6,2021-02-08,DESCARTADA,Hospital Regional (Coihaique),Región de Aysén del General Carlos Ibáñez del ...,SEREMI De Aisén del General Carlos Ibañez del ...,...,DESCONOCIDO,,Región de Aysén del General Carlos Ibáñez del ...,Coyhaique,Coyhaique,Coyhaique,11101.0,28763.0,29055.0,57818.0


In [10]:
# Transforma Fechas a formato DateTime 

data_aysen_filtered['fecha_notificacion'] = pd.to_datetime(data_aysen_filtered['fecha_notificacion'], errors = 'coerce') 

data_aysen_filtered['fecha_toma_muestra_1'] = pd.to_datetime(data_aysen_filtered['fecha_toma_muestra_1'], errors = 'coerce')

data_aysen_filtered['fecha_toma_muestra_2'] = pd.to_datetime(data_aysen_filtered['fecha_toma_muestra_2'], errors = 'coerce')

data_aysen_filtered['fecha_toma_muestra_3'] = pd.to_datetime(data_aysen_filtered['fecha_toma_muestra_3'], errors = 'coerce')

data_aysen_filtered['fecha_resultado_pcr_1'] = pd.to_datetime(data_aysen_filtered['fecha_resultado_pcr_1'], errors = 'coerce')

data_aysen_filtered['fecha_resultado_pcr_2'] = pd.to_datetime(data_aysen_filtered['fecha_resultado_pcr_2'], errors = 'coerce')

data_aysen_filtered['fecha_resultado_pcr_3'] = pd.to_datetime(data_aysen_filtered['fecha_resultado_pcr_3'], errors = 'coerce')

In [11]:
# Muestra variables presente en DB en formato DF

s=pd.DataFrame(data_aysen_filtered.columns)

s[s[0]=='tipo_seguimiento']


Unnamed: 0,0


In [12]:
# Selecciona variables de importancia

data_aysen_clean =  data_aysen_filtered[[
                                'numero_folio',
                                'comuna_residencia',
                                'fecha_notificacion',
                                'semana_epidemiologica',
                                'etapa_clinica',
                                'tipo_caso_busqueda',
                                'establecimiento_salud',
                                'resultado_pcr_1',
                                'resultado_pcr_2',
                                'resultado_pcr_3',
                                'fecha_toma_muestra_1',
                                'fecha_toma_muestra_2',
                                'fecha_toma_muestra_3',
                                'fecha_resultado_pcr_1',
                                'fecha_resultado_pcr_2',
                                'fecha_resultado_pcr_3',
                                'estado_paciente',
                                'lugar_reposo',
                                'estado_caso',
                                'presentacion_clinica',
                                'contacto_caso_sospechoso',
                                'motivo_examen',
                                'hospitalizacion',
                                'trabajador_salud',
                                'caso_cerrado',
                                'fecha_primeros_sintomas',
                                'fecha_diagnostico',
                                'comuna_seremi_xi',
                                'provincia_seremi_xi',
                                'sexo',
                                'edad',
                                'pop_hombres',
                                'pop_mujeres',
                                'pop_total'
                               ]]

In [13]:
# Agrega 53 semanas a las semanas de 2021 y crea semana_epidemiologica_21

data_aysen_clean1 = data_aysen_clean[data_aysen_clean['fecha_notificacion']<=pd.to_datetime('2021-01-02')]
data_aysen_clean2 = data_aysen_clean[data_aysen_clean['fecha_notificacion']>=pd.to_datetime('2021-01-03')]


data_aysen_clean1['semana_epidemiologica_21'] = data_aysen_clean1['semana_epidemiologica']
data_aysen_clean2['semana_epidemiologica_21'] = data_aysen_clean2['semana_epidemiologica']+53

data_aysen_clean_21 = data_aysen_clean1.append(data_aysen_clean2, ignore_index=True)


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  data_aysen_clean1['semana_epidemiologica_21'] = data_aysen_clean1['semana_epidemiologica']
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  data_aysen_clean2['semana_epidemiologica_21'] = data_aysen_clean2['semana_epidemiologica']+53


In [14]:
data_aysen_clean.sample(10)

Unnamed: 0,numero_folio,comuna_residencia,fecha_notificacion,semana_epidemiologica,etapa_clinica,tipo_caso_busqueda,establecimiento_salud,resultado_pcr_1,resultado_pcr_2,resultado_pcr_3,...,caso_cerrado,fecha_primeros_sintomas,fecha_diagnostico,comuna_seremi_xi,provincia_seremi_xi,sexo,edad,pop_hombres,pop_mujeres,pop_total
34166,5424256,O'Higgins,2020-12-09,50,DESCARTADA,Búsqueda activa,Posta de Salud Rural Villa O'Higgins,NEGATIVO,,,...,False,,2020-12-11,O'Higgins,Capitan Prat,hombre,38,374.0,251.0,625.0
103818,12335456,Coyhaique,2021-05-17,20,CONFIRMADA,Búsqueda activa,Actividades gestionadas por la Dirección del S...,POSITIVO,,,...,False,2021-05-17,2021-05-18,Coyhaique,Coyhaique,hombre,41,28763.0,29055.0,57818.0
140116,15056546,Cisnes,2021-07-18,29,DESCARTADA,Atención médica,Hospital Dr. Jorge Ibar (Cisnes),NEGATIVO,,,...,False,2021-07-15,,Cisnes,Aysen,hombre,41,3922.0,2595.0,6517.0
124894,13818588,Aisén,2021-06-16,24,DESCARTADA,Búsqueda activa,Centro de Salud Familiar Puerto Aysen,NEGATIVO,NEGATIVO,,...,False,,2021-06-16,Aysen,Aysen,hombre,29,12719.0,11240.0,23959.0
13955,3082927,Coyhaique,2020-09-28,40,DESCARTADA,Búsqueda activa,Actividades gestionadas por la Dirección del S...,,,,...,False,,2020-09-30,Coyhaique,Coyhaique,hombre,88,28763.0,29055.0,57818.0
68522,8924522,Coyhaique,2021-03-04,9,DESCARTADA,Búsqueda activa,Actividades gestionadas por la Dirección del S...,NEGATIVO,,,...,False,,2021-03-06,Coyhaique,Coyhaique,mujer,30,28763.0,29055.0,57818.0
73234,9436337,Aisén,2021-03-16,11,DESCARTADA,Búsqueda activa,Centro de Salud Familiar Puerto Aysen,NEGATIVO,,,...,False,,2021-03-16,Aysen,Aysen,mujer,40,12719.0,11240.0,23959.0
28474,4784705,Aisén,2020-11-20,47,DESCARTADA,Búsqueda activa,Ejercicio libre de la profesión XI región,,,,...,False,,2020-11-20,Ejercicio Libre de la Profesión,Ejercicio Libre de la Profesión,hombre,27,,,
25221,4423349,Aisén,2020-11-10,46,CONFIRMADA,Atención médica,Hospital de Puerto Aysén,POSITIVO,,,...,False,2020-11-07,2020-11-10,Aysen,Aysen,hombre,51,12719.0,11240.0,23959.0
59067,7985642,Coyhaique,2021-02-08,6,DESCARTADA,Búsqueda activa,Actividades gestionadas por la Dirección del S...,NEGATIVO,,,...,False,,2021-02-09,Coyhaique,Coyhaique,hombre,40,28763.0,29055.0,57818.0


In [15]:
df_seguimiento = pd.read_csv('data/df_seguimiento_full.csv',
                            sep=';',
                             low_memory=False
                            )

In [16]:
df_seguimiento

Unnamed: 0.1,Unnamed: 0,n_folio,tipo_seguimiento,dia_contacto,id_enfermedad_eno,enfermedad,fecha_notificacion,id_institucion,nombre_institucion_indice,region_institucion_indice,...,cumple_aislamiento_cuarentena,ultimo_establecimiento_derivacion,nombre_ultimo_establecimiento_derivacion,ultimo_seremi_derivacion,región_derivación,región_seremi,región_notificacion,region_final,TTA,file
0,0,8753781,caso,2021-03-02 00:00:00,50,Coronavirus (COVID-19),2021-03-01 00:00:00,125100,Hospital Regional (Coihaique),11,...,t,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Región De Aysén del General Carlos Ibañez del ...,Región de Aysén del General Carlos Ibáñez del ...,SEREMI,marzo
1,1,SC9677760-11425750,contacto,2021-03-25 00:00:00,50,Coronavirus (COVID-19),2021-03-20 00:00:00,125100,Hospital Regional (Coihaique),11,...,t,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Región De Aysén del General Carlos Ibañez del ...,Región de Aysén del General Carlos Ibáñez del ...,APS,marzo
2,2,SC9780675-11714657,contacto,2021-03-29 00:00:00,50,Coronavirus (COVID-19),2021-03-23 00:00:00,125010,Actividades gestionadas por la Dirección del S...,11,...,t,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Región De Aysén del General Carlos Ibañez del ...,Región de Aysén del General Carlos Ibáñez del ...,SEREMI,marzo
3,3,SC10084431-11964234,contacto,2021-03-29 00:00:00,50,Coronavirus (COVID-19),2021-03-29 00:00:00,125010,Actividades gestionadas por la Dirección del S...,11,...,t,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Región De Aysén del General Carlos Ibañez del ...,Región de Aysén del General Carlos Ibáñez del ...,SEREMI,marzo
4,4,SC10332193-12293320,contacto,2021-04-04 00:00:00,50,Coronavirus (COVID-19),2021-04-03 00:00:00,125404,Posta de Salud Rural Lago Verde,11,...,t,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Región De Aysén del General Carlos Ibañez del ...,Región de Aysén del General Carlos Ibáñez del ...,SEREMI,marzo
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
293816,293849,SC16034389-20188901,contacto,2021-08-25 00:00:00,50,Coronavirus (COVID-19),2021-08-15 00:00:00,125100,Hospital Regional (Coihaique),11,...,t,125300,Consultorio Víctor Domingo Silva,Sin Datos,Región De Aysén del General Carlos Ibañez del ...,Sin Datos,Región De Aysén del General Carlos Ibañez del ...,Región de Aysén del General Carlos Ibáñez del ...,APS,agosto
293817,293850,PNTM-7016056768,no notificado índice,Sin Datos,50,Coronavirus (COVID-19),Sin Datos,Sin Datos,Sin Datos,Sin Datos,...,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Región de Aysén del General Carlos Ibáñez del ...,SEREMI,agosto
293818,293851,PNTM-7015472903,no notificado índice,Sin Datos,50,Coronavirus (COVID-19),Sin Datos,Sin Datos,Sin Datos,Sin Datos,...,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Región de Aysén del General Carlos Ibáñez del ...,SEREMI,agosto
293819,293852,PNTM-7015314831,no notificado índice,Sin Datos,50,Coronavirus (COVID-19),Sin Datos,Sin Datos,Sin Datos,Sin Datos,...,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Sin Datos,Región de Aysén del General Carlos Ibáñez del ...,SEREMI,agosto


In [17]:
# Divide strings utilizando regex para extraer nfolio de casos, 
# Separa nfolio caso indice de nfolio contacto estrecho y guarda caso índice
# Y extrae datos de PNTM

df_seguimiento['n_folio'].str.extract(r'([0-9]+)|SC[0-9]+-([0-9]+)|PNTM-([0-9]+)', flags=0,expand=True).rename(columns={0:'nfolio_caso',
                                                                                                          1:'nfolio_caso_indice',
                                                                                                          2:'nfolio_pntm'
                                                                                                        })

Unnamed: 0,nfolio_caso,nfolio_caso_indice,nfolio_pntm
0,8753781,,
1,,11425750,
2,,11714657,
3,,11964234,
4,,12293320,
...,...,...,...
293816,,20188901,
293817,,,7016056768
293818,,,7015472903
293819,,,7015314831


In [18]:
# Separa nfolio caso índice de nfolio contacto estrecho y guarda contacto estrecho

df_seguimiento['n_folio'].str.extract(r'SC([0-9]+)-', 
                                      flags=0,
                                      expand=True).rename(
                                      columns={0:'nfolio_contacto_estrecho'})

Unnamed: 0,nfolio_contacto_estrecho
0,
1,9677760
2,9780675
3,10084431
4,10332193
...,...
293816,16034389
293817,
293818,
293819,


In [19]:
# Realiza merge con DF original utilizando index de importación
df_seguimiento_merged = df_seguimiento.merge(df_seguimiento['n_folio'].str.extract(
                                                 r'([0-9]+)|SC[0-9]+-([0-9]+)|PNTM-([0-9]+)', 
                                                 flags=0,
                                                 expand=True).rename(
                                                 columns={0:'nfolio_caso',
                                                          1:'nfolio_caso_indice',
                                                          2:'nfolio_pntm'}), 
                                             how='left',
                                             left_index= True,
                                             right_index=True
                                      ).merge(df_seguimiento['n_folio'].str.extract(
                                                                 r'SC([0-9]+)-', 
                                                                 flags=0,
                                                                 expand=True).rename(
                                                                 columns={0:'nfolio_contacto_estrecho'}), 
                                                                 how='left',
                                                                 left_index= True,
                                                                 right_index=True
                                      )

df_seguimiento_merged.sample(3)

Unnamed: 0.1,Unnamed: 0,n_folio,tipo_seguimiento,dia_contacto,id_enfermedad_eno,enfermedad,fecha_notificacion,id_institucion,nombre_institucion_indice,region_institucion_indice,...,región_derivación,región_seremi,región_notificacion,region_final,TTA,file,nfolio_caso,nfolio_caso_indice,nfolio_pntm,nfolio_contacto_estrecho
156337,156360,14218061,caso,Sin Datos,50,Coronavirus (COVID-19),2021-06-25 00:00:00,125010,Actividades gestionadas por la Dirección del S...,11,...,Sin Datos,Sin Datos,Región De Aysén del General Carlos Ibañez del ...,Región de Aysén del General Carlos Ibáñez del ...,APS,junio,14218061,,,
106515,106533,12183021,caso,Sin Datos,50,Coronavirus (COVID-19),2021-05-13 00:00:00,125301,Consultorio Alejandro Gutiérrez,11,...,Sin Datos,Sin Datos,Región De Aysén del General Carlos Ibañez del ...,Región de Aysén del General Carlos Ibáñez del ...,SEREMI,mayo,12183021,,,
277652,277684,16276209,caso,Sin Datos,50,Coronavirus (COVID-19),2021-08-23 00:00:00,114321,Centro de Salud Familiar Cardenal Silva Henríq...,13,...,Sin Datos,Sin Datos,Región Metropolitana de Santiago,Región de Aysén del General Carlos Ibáñez del ...,APS,agosto,16276209,,,


In [20]:
df_seguimiento_merged.head()

Unnamed: 0.1,Unnamed: 0,n_folio,tipo_seguimiento,dia_contacto,id_enfermedad_eno,enfermedad,fecha_notificacion,id_institucion,nombre_institucion_indice,region_institucion_indice,...,región_derivación,región_seremi,región_notificacion,region_final,TTA,file,nfolio_caso,nfolio_caso_indice,nfolio_pntm,nfolio_contacto_estrecho
0,0,8753781,caso,2021-03-02 00:00:00,50,Coronavirus (COVID-19),2021-03-01 00:00:00,125100,Hospital Regional (Coihaique),11,...,Sin Datos,Sin Datos,Región De Aysén del General Carlos Ibañez del ...,Región de Aysén del General Carlos Ibáñez del ...,SEREMI,marzo,8753781.0,,,
1,1,SC9677760-11425750,contacto,2021-03-25 00:00:00,50,Coronavirus (COVID-19),2021-03-20 00:00:00,125100,Hospital Regional (Coihaique),11,...,Sin Datos,Sin Datos,Región De Aysén del General Carlos Ibañez del ...,Región de Aysén del General Carlos Ibáñez del ...,APS,marzo,,11425750.0,,9677760.0
2,2,SC9780675-11714657,contacto,2021-03-29 00:00:00,50,Coronavirus (COVID-19),2021-03-23 00:00:00,125010,Actividades gestionadas por la Dirección del S...,11,...,Sin Datos,Sin Datos,Región De Aysén del General Carlos Ibañez del ...,Región de Aysén del General Carlos Ibáñez del ...,SEREMI,marzo,,11714657.0,,9780675.0
3,3,SC10084431-11964234,contacto,2021-03-29 00:00:00,50,Coronavirus (COVID-19),2021-03-29 00:00:00,125010,Actividades gestionadas por la Dirección del S...,11,...,Sin Datos,Sin Datos,Región De Aysén del General Carlos Ibañez del ...,Región de Aysén del General Carlos Ibáñez del ...,SEREMI,marzo,,11964234.0,,10084431.0
4,4,SC10332193-12293320,contacto,2021-04-04 00:00:00,50,Coronavirus (COVID-19),2021-04-03 00:00:00,125404,Posta de Salud Rural Lago Verde,11,...,Sin Datos,Sin Datos,Región De Aysén del General Carlos Ibañez del ...,Región de Aysén del General Carlos Ibáñez del ...,SEREMI,marzo,,12293320.0,,10332193.0


In [21]:
# Revisa folio en DB de notificaciones

data_aysen_clean[data_aysen_clean['numero_folio']==14832232]

Unnamed: 0,numero_folio,comuna_residencia,fecha_notificacion,semana_epidemiologica,etapa_clinica,tipo_caso_busqueda,establecimiento_salud,resultado_pcr_1,resultado_pcr_2,resultado_pcr_3,...,caso_cerrado,fecha_primeros_sintomas,fecha_diagnostico,comuna_seremi_xi,provincia_seremi_xi,sexo,edad,pop_hombres,pop_mujeres,pop_total
137274,14832232,Coyhaique,2021-07-11,28,CONFIRMADA,Atención médica,Hospital Regional (Coihaique),NEGATIVO,POSITIVO,,...,False,2021-07-09,2021-07-12,Coyhaique,Coyhaique,mujer,47,28763.0,29055.0,57818.0


In [22]:
# Todos los datos poseen un folio 

df_seguimiento_merged[df_seguimiento_merged['n_folio'].isnull()]

Unnamed: 0.1,Unnamed: 0,n_folio,tipo_seguimiento,dia_contacto,id_enfermedad_eno,enfermedad,fecha_notificacion,id_institucion,nombre_institucion_indice,region_institucion_indice,...,región_derivación,región_seremi,región_notificacion,region_final,TTA,file,nfolio_caso,nfolio_caso_indice,nfolio_pntm,nfolio_contacto_estrecho


In [23]:
df_seguimiento_merged.columns

Index(['Unnamed: 0', 'n_folio', 'tipo_seguimiento', 'dia_contacto',
       'id_enfermedad_eno', 'enfermedad', 'fecha_notificacion',
       'id_institucion', 'nombre_institucion_indice',
       'region_institucion_indice', 'nombre_region_institucion_indice',
       'institucion_contacto', 'nombre_institucion_seguimiento', 'region',
       'id_region', 'run_profesional', 'nombre_profesional',
       'identificacion_paciente', 'n_identificacion_paciente',
       'nombre_paciente', 'primer_apellido_paciente',
       'fecha_cumple_requisitos', 'cont_tipo_identificacion',
       'cont_n_identificacion', 'cont_nombres', 'cont_primer_apellido',
       'cont_segundo_apellido', 'cont_sexo', 'cont_fecha_nacimiento',
       'cont_edad', 'cont_tipo_direccion', 'cont_tipo_institucion',
       'cont_via_residencia', 'cont_direccions', 'cont_n_residencia',
       'cont_dpto', 'cont_poblacion', 'cont_region', 'cont_comuna',
       'cont_n_telefono', 'cont_n_celular', 'cont_correo_electronico',
       '

In [24]:
pd.DataFrame(df_seguimiento_merged.columns).rename(columns={0:'variables_seguimiento'}).transpose()

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,80,81,82,83,84,85,86,87,88,89
variables_seguimiento,Unnamed: 0,n_folio,tipo_seguimiento,dia_contacto,id_enfermedad_eno,enfermedad,fecha_notificacion,id_institucion,nombre_institucion_indice,region_institucion_indice,...,región_derivación,región_seremi,región_notificacion,region_final,TTA,file,nfolio_caso,nfolio_caso_indice,nfolio_pntm,nfolio_contacto_estrecho


In [25]:
df_seguimiento_merged['folio_se_convierte_en_caso']

0         Sin Datos
1         Sin Datos
2         Sin Datos
3         Sin Datos
4         Sin Datos
            ...    
293816    Sin Datos
293817    Sin Datos
293818    Sin Datos
293819    Sin Datos
293820     16161119
Name: folio_se_convierte_en_caso, Length: 293821, dtype: object

In [26]:
# Revisa existencia de una variable dentro del DF y sus respectivos valores

df_seguimiento_merged['folio_se_convierte_en_caso'].value_counts()


Sin Datos    277894
-1              528
14560708         36
10748118         33
10746410         33
              ...  
12552731          1
13618714          1
13553120          1
13140836          1
11937076          1
Name: folio_se_convierte_en_caso, Length: 2669, dtype: int64

# Variables de interes


|Variable|Tipo|Observación|
|---|---|---|
|`n_folio`|Text|folio generado por Número y Letras|
|`nfolio_caso`|Numeric|folio de caso registrado|
|`nfolio_caso_indice`|Numeric|folio de caso indice registrado|
|`nfolio_pntm`|Numeric|folio plataforma nacional de toma de muestra|
|`nfolio_contacto_estrecho`|Numeric|folio de contacto estrecho|
|`tipo_seguimiento`|Text|contacto, caso, no notificado indice|
|`dia_contacto`|DateTime|Fecha de contacto |
|`fecha_notificacion`|DateTime|Fecha de notificación|
|`nombre_institucion_indice`|Text|Nombre institución desde donde se deriva el caso|
|`region_institucion_indice`|Numeric| Región d ela cual se deriva el caso|
|`nombre_region_institucion_indice`|Text|Nombre de región de la institución índice|
|`nombre_institucion_seguimiento`|Text|Nombre de la institución encargada de realizar seguimiento|
|`region`|Text|Región en la cual se realiza el seguimiento|
|`id_region`|Numeric|Número de la región de seguimiento|
|`fecha_cumple_requisitos`|DateTime|Fecha en la cual cumple requisitos para seguimiento|
|`TTA`|Text|APS o SEREMI|
|`cumple_aislamiento_cuarentena`|Boolean|Sin datos, t, f|
|`folio_se_convierte_en_caso`|Text|Número de folio o Sin Datos|
|`visible_no_eliminado`|Boolean|Sin datos, t, f|
|`suspendido`|Text|egresado|
|`sintomas`|Text|Sintomatología, Sin datos o Ninguno|
|`observacion_seguimiento_contactos`|Text| Escrito por el trazador|
|`tiene_resultado_covid`|Text|Positivo, Negativo, No concluyente, Sin Datos|
|`derivacion_a_su`|Boolean| t f Sin datos|
|`derivacion_toma_muestra`|Boolean|t f Sin datos|
|`fecha_derivacion_toma_muestra`|Text|Fecha Sin datos|
|`cont_fecha_seguimiento`|Text|Texto o Sin Datos|
|`cont_tipo_contacto`|Text|contacto_familiar, contacto_social, contacto_institucional, contacto_laboral|
|||contacto_pasajero, contacto_sala_espera, contacto_personal_salud,Datos|
|`cont_parentesco`|Text|Hijo/a, Madre/Padre, Otro familiar, Pareja, Hermano/a, Otra relación/No familiar, Sin Datos|
|`cont_otra_relacion`|Text|Sin Datos, otro, hijo de cuidadora, otro adulto mayor en cuidado, cuñado. sobrino de cuidadora, AMIGO,  Amigo|
||| pareja del tío de su madre,cuidadora, PAREJA PADRE, otro adulto en cuidados, Pareja de mamá, Hijastro|
|`cont_tipo_transporte`|Text|Aéreo, Sin Datos, Terrestre|
|`cont_nombre_vuelo`|Text|Sin Datos, JETSMART JA245 CCP - BALMACEDA, SKY 433, COPA CM111, 
|||SKY 433 STGO- COYHAIQUE 21-08-2021 / 11 AM, SK, DL147 ATLANTA - STGO, JETSMART CCP-BALMACEDA, LA 272 |
|||JETSMART JA245, VUELO CM111, LA272, JETSMART JA 245 CCP - BALMACEDA|                 
|`cont_fecha_llegada`|Text|Sin Datos, 2021-07-21, 2021-08-21, 2021-07-01, 2021-07-03, 2021-07-09, 2021-07-02|
|`detalle_pasajero`|Text|Observaciones adicionales de viaje|
|`cont_inicio_cuarentena`|DateTime|Fecha de inicio de cuarentena|
|`cont_fin_cuarentena`|DateTime|Fecha y Sin Datos|
|`cont_requiere_licencia_medica`|Boolean|Sin Datos, NO, SI, Seleccione|
|`cont_se_emite_licencia`|Boolean|Sin Datos, t, f|
|`cont_fecha_licencia`|DateTime|Fecha de licencia|
|`requiere_canasta_alimentos`|Boolean|Sin Datos, t, f|
|`cantidad_personas_vivienda`|Numeric|Integrantes familiares de 0 a 6|
|`cont_estado_seguimiento`|Text|Aún no contactado, En proceso de seguimiento, Se transforma en caso, Contacto sintomático, No localizado|
|`fecha_creacion`|DateTime|Fecha de creación|
|`tipo_del_contacto`|Text|Sin Datos, Llamada telefónica, Visita domiciliaria|
|`contacto_localizado`|Boolean|Sin Datos, t, f|
|`empresa`|Text|Información de Empresa de trabajo|
|`institucion`|Text|Información de la institución|

## Limpieza y ordenamiento de datos



Segun variables seleccionadas como de importancia de análisis y obsrvaciones a filtrar

In [27]:
# Transforma fecha_cumple_requisitos a formato DateTime64 

df_seguimiento_merged['fecha_cumple_requisitos'] = pd.to_datetime(df_seguimiento_merged['fecha_cumple_requisitos'], errors='coerce')
df_seguimiento_merged['fecha_notificacion'] = pd.to_datetime(df_seguimiento_merged['fecha_notificacion'], errors='coerce')
df_seguimiento_merged['fecha_creacion'] = pd.to_datetime(df_seguimiento_merged['fecha_creacion'], errors='coerce')

#Crea diferencia de fecha
df_seguimiento_merged['dif_fecha'] = df_seguimiento_merged['fecha_cumple_requisitos'] - df_seguimiento_merged['fecha_notificacion']

In [28]:
# Filtra los timedelta mayores a 14 dias

seg = df_seguimiento_merged[df_seguimiento_merged['dif_fecha']<pd.to_timedelta('14 days')]

In [29]:
#Filtra visible_no_eliminado y bota duplicados en n_folio

aux = seg[seg['visible_no_eliminado']=='t'].drop_duplicates('n_folio')

In [30]:
# Filtra tipo_seguimiento para los casos 

aux_caso = aux[aux['tipo_seguimiento']=='caso']

In [31]:
aux_contacto = aux[aux['tipo_seguimiento']=='contacto']
#Crea columna dif_fecha_contacto
aux_contacto['dif_fecha_contacto'] = aux_contacto['fecha_creacion']-aux_contacto['fecha_notificacion']

aux_contacto = aux_contacto[aux_contacto['dif_fecha_contacto']>=pd.to_timedelta(-14)]

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  aux_contacto['dif_fecha_contacto'] = aux_contacto['fecha_creacion']-aux_contacto['fecha_notificacion']


In [32]:
aux_contacto_nuevos = aux[aux['tipo_seguimiento']=='contacto']
aux_contacto_nuevos = aux_contacto_nuevos[(aux_contacto_nuevos['suspendido']=='activo')|(aux_contacto_nuevos['suspendido']=='egresado')]


In [33]:
"""aux_contacto_viejos = aux_contacto[(aux_contacto['fecha_creacion']-pd.to_timedelta('7 days'))]

aux_contacto_viejos= aux_contacto_viejos[(aux_contacto_viejos['suspendido']=='activo')|(aux_contacto_viejos['suspendido']=='egresado')]"""


"aux_contacto_viejos = aux_contacto[(aux_contacto['fecha_creacion']-pd.to_timedelta('7 days'))]\n\naux_contacto_viejos= aux_contacto_viejos[(aux_contacto_viejos['suspendido']=='activo')|(aux_contacto_viejos['suspendido']=='egresado')]"

In [34]:
#aux_contacto[
(aux_contacto['fecha_creacion']-pd.to_timedelta('7 days'))
#]

1        2021-03-15 12:49:44.051748
2        2021-03-18 18:23:53.976693
3        2021-03-22 17:55:07.453245
4        2021-03-27 13:40:31.874120
5        2021-03-29 20:26:57.278563
                    ...            
293456   2021-08-13 19:40:56.582091
293485   2021-08-05 18:15:06.027185
293525   2021-08-09 23:23:22.867003
293560   2021-08-21 11:34:20.083839
293814   2021-08-10 19:43:02.977625
Name: fecha_creacion, Length: 15525, dtype: datetime64[ns]

In [35]:
aux_contacto['fecha_creacion']-pd.to_timedelta(-7)

1        2021-03-22 12:49:44.051748007
2        2021-03-25 18:23:53.976693007
3        2021-03-29 17:55:07.453245007
4        2021-04-03 13:40:31.874120007
5        2021-04-05 20:26:57.278563007
                      ...             
293456   2021-08-20 19:40:56.582091007
293485   2021-08-12 18:15:06.027185007
293525   2021-08-16 23:23:22.867003007
293560   2021-08-28 11:34:20.083839007
293814   2021-08-17 19:43:02.977625007
Name: fecha_creacion, Length: 15525, dtype: datetime64[ns]

In [36]:
aux_contacto['fecha_creacion']

1        2021-03-22 12:49:44.051748
2        2021-03-25 18:23:53.976693
3        2021-03-29 17:55:07.453245
4        2021-04-03 13:40:31.874120
5        2021-04-05 20:26:57.278563
                    ...            
293456   2021-08-20 19:40:56.582091
293485   2021-08-12 18:15:06.027185
293525   2021-08-16 23:23:22.867003
293560   2021-08-28 11:34:20.083839
293814   2021-08-17 19:43:02.977625
Name: fecha_creacion, Length: 15525, dtype: datetime64[ns]

In [37]:
df_seguimiento_merged['visible_no_eliminado']

0         t
1         t
2         t
3         t
4         t
         ..
293816    t
293817    t
293818    t
293819    t
293820    t
Name: visible_no_eliminado, Length: 293821, dtype: object

In [38]:
data_aysen_clean

Unnamed: 0,numero_folio,comuna_residencia,fecha_notificacion,semana_epidemiologica,etapa_clinica,tipo_caso_busqueda,establecimiento_salud,resultado_pcr_1,resultado_pcr_2,resultado_pcr_3,...,caso_cerrado,fecha_primeros_sintomas,fecha_diagnostico,comuna_seremi_xi,provincia_seremi_xi,sexo,edad,pop_hombres,pop_mujeres,pop_total
0,50166,Coyhaique,2020-03-12,11,DESCARTADA,,Hospital Regional (Coihaique),NEGATIVO,,,...,False,2020-03-10,2020-03-16,Coyhaique,Coyhaique,mujer,46,28763.0,29055.0,57818.0
2,50785,Coyhaique,2020-03-12,11,DESCARTADA,,Hospital Regional (Coihaique),NEGATIVO,,,...,False,2020-03-10,2020-03-28,Coyhaique,Coyhaique,hombre,12,28763.0,29055.0,57818.0
3,50794,Coyhaique,2020-03-12,11,DESCARTADA,,Hospital Regional (Coihaique),NEGATIVO,,,...,False,2020-03-10,2020-03-28,Coyhaique,Coyhaique,hombre,11,28763.0,29055.0,57818.0
5,53499,Cisnes,2020-03-18,12,DESCARTADA,,Centro de Salud Familiar La Junta,NEGATIVO,,,...,False,2020-03-15,2020-03-24,Cisnes,Aysen,mujer,48,3922.0,2595.0,6517.0
7,54731,Cisnes,2020-03-19,12,DESCARTADA,Atención médica,Centro de Salud Familiar La Junta,NO CONCLUYENTE,,,...,False,2020-03-19,2020-03-21,Cisnes,Aysen,hombre,0,3922.0,2595.0,6517.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
161660,16681784,Cochrane,2021-09-04,36,SOSPECHA,Atención médica,Hospital Lord Cochrane,NEGATIVO,,,...,False,2021-09-03,,Cochrane,Capitan Prat,mujer,37,1902.0,1588.0,3490.0
161661,16681803,Cochrane,2021-09-04,36,SOSPECHA,Atención médica,Hospital Lord Cochrane,,,,...,False,2021-09-04,,Cochrane,Capitan Prat,hombre,6,1902.0,1588.0,3490.0
161662,16681835,Cochrane,2021-09-04,36,SOSPECHA,Atención médica,Hospital Lord Cochrane,,,,...,False,2021-09-03,,Cochrane,Capitan Prat,hombre,11,1902.0,1588.0,3490.0
161663,16682064,Aisén,2021-09-05,36,SOSPECHA,Atención médica,Hospital de Puerto Aysén,,,,...,False,2021-08-31,,Aysen,Aysen,mujer,5,12719.0,11240.0,23959.0


In [39]:
df_seguimiento_filtered = df_seguimiento_merged

In [40]:
# Revisa tipo de datos
df_seguimiento_filtered['nfolio_caso'].dtype

dtype('O')

In [42]:
# Revisa tipo de datos para merging

data_aysen_clean['numero_folio'].dtype

dtype('int64')

In [43]:
# Transforma dtype de ambas columnas a float64 para permitir merging 

df_seguimiento_filtered['nfolio_caso']= df_seguimiento_filtered['nfolio_caso'].astype('float64', errors='raise')


data_aysen_clean['numero_folio']= data_aysen_clean['numero_folio'].astype('float64', errors='raise')

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  data_aysen_clean['numero_folio']= data_aysen_clean['numero_folio'].astype('float64', errors='raise')


In [44]:
# Combina ambas columnas para nfolio_caso y nfolio_contacto_estrecho y 
# agrega NA en donde corresponda a otros casos como PNTM o nfolio_caso_indice

df_seguimiento_filtered['nfolio_merge'] = df_seguimiento_filtered['nfolio_caso'].combine_first(df_seguimiento_filtered['nfolio_contacto_estrecho']).astype('float64', errors='raise')



In [45]:
# Realiza merge con base de datos de notificaciones agregando los valores de casos confirmados y probables


df_seguimiento_filtered= df_seguimiento_filtered.merge(data_aysen_clean[[
                                            'numero_folio',
                                            'etapa_clinica',
                                            'tipo_caso_busqueda',
                                            'establecimiento_salud',
                                            'resultado_pcr_1',
                                            'resultado_pcr_2',
                                            'resultado_pcr_3',
                                            'fecha_resultado_pcr_1',
                                            'fecha_resultado_pcr_2',
                                            'fecha_resultado_pcr_3',
                                            'comuna_seremi_xi',
                                            'provincia_seremi_xi',
                                            'edad',
                                            'sexo',
                                            'pop_hombres',
                                            'pop_mujeres',
                                            'pop_total'
                                        ]], left_on='nfolio_merge', right_on='numero_folio' , how='left')

In [46]:
# Selecciona variables de importancia

df_seguimiento_clean = df_seguimiento_filtered[[
    'n_folio',
    'nfolio_caso',
    'nfolio_caso_indice',
    'nfolio_pntm',
    'nfolio_contacto_estrecho',
    'tipo_seguimiento',
    'dia_contacto',
    'fecha_notificacion',
    'nombre_institucion_indice',
    'region_institucion_indice',
    'nombre_region_institucion_indice',
    'region',
    'id_region',
    'fecha_cumple_requisitos',
    'TTA',
    'cumple_aislamiento_cuarentena',
    'folio_se_convierte_en_caso',
    'visible_no_eliminado',
    'suspendido',
    'sintomas',
    'observacion_seguimiento_contactos',
    'tiene_resultado_covid',
    'derivacion_a_su',
    'derivacion_toma_muestra',
    'fecha_derivacion_toma_muestra',
    'cont_fecha_seguimiento',
    'cont_tipo_contacto',
    'cont_parentesco',
    'cont_otra_relacion',
    'cont_tipo_transporte',
    'cont_nombre_vuelo',
    'cont_fecha_llegada',
    'detalle_pasajero',
    'cont_inicio_cuarentena',
    'cont_fin_cuarentena',
    'cont_requiere_licencia_medica',
    'cont_se_emite_licencia',
    'cont_fecha_licencia',
    'requiere_canasta_alimentos',
    'cantidad_personas_vivienda',
    'cont_estado_seguimiento',
    'fecha_creacion',
    'tipo_del_contacto',
    'contacto_localizado',
    'empresa',
    'institucion',
    'etapa_clinica',
    'tipo_caso_busqueda',
    'establecimiento_salud',
    'resultado_pcr_1',
    'resultado_pcr_2',
    'resultado_pcr_3',
    'fecha_resultado_pcr_1',
    'fecha_resultado_pcr_2',
    'fecha_resultado_pcr_3',
    'comuna_seremi_xi',
    'provincia_seremi_xi',
    'edad',
    'sexo',
    'pop_hombres',
    'pop_mujeres',
    'pop_total'
]]

In [47]:
df_seguimiento_clean

Unnamed: 0,n_folio,nfolio_caso,nfolio_caso_indice,nfolio_pntm,nfolio_contacto_estrecho,tipo_seguimiento,dia_contacto,fecha_notificacion,nombre_institucion_indice,region_institucion_indice,...,fecha_resultado_pcr_1,fecha_resultado_pcr_2,fecha_resultado_pcr_3,comuna_seremi_xi,provincia_seremi_xi,edad,sexo,pop_hombres,pop_mujeres,pop_total
0,8753781,8753781.0,,,,caso,2021-03-02 00:00:00,2021-03-01,Hospital Regional (Coihaique),11,...,2021-03-02,2021-03-26,NaT,Coyhaique,Coyhaique,47.0,hombre,28763.0,29055.0,57818.0
1,SC9677760-11425750,,11425750,,9677760,contacto,2021-03-25 00:00:00,2021-03-20,Hospital Regional (Coihaique),11,...,2021-03-22,2021-03-21,NaT,Coyhaique,Coyhaique,19.0,mujer,28763.0,29055.0,57818.0
2,SC9780675-11714657,,11714657,,9780675,contacto,2021-03-29 00:00:00,2021-03-23,Actividades gestionadas por la Dirección del S...,11,...,NaT,NaT,NaT,Coyhaique,Coyhaique,31.0,mujer,28763.0,29055.0,57818.0
3,SC10084431-11964234,,11964234,,10084431,contacto,2021-03-29 00:00:00,2021-03-29,Actividades gestionadas por la Dirección del S...,11,...,2021-03-31,NaT,NaT,Coyhaique,Coyhaique,15.0,mujer,28763.0,29055.0,57818.0
4,SC10332193-12293320,,12293320,,10332193,contacto,2021-04-04 00:00:00,2021-04-03,Posta de Salud Rural Lago Verde,11,...,NaT,NaT,NaT,Lago Verde,Coyhaique,82.0,hombre,494.0,358.0,852.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
293816,SC16034389-20188901,,20188901,,16034389,contacto,2021-08-25 00:00:00,2021-08-15,Hospital Regional (Coihaique),11,...,2021-08-16,2021-08-19,NaT,Coyhaique,Coyhaique,5.0,mujer,28763.0,29055.0,57818.0
293817,PNTM-7016056768,,,7016056768,,no notificado índice,Sin Datos,NaT,Sin Datos,Sin Datos,...,NaT,NaT,NaT,,,,,,,
293818,PNTM-7015472903,,,7015472903,,no notificado índice,Sin Datos,NaT,Sin Datos,Sin Datos,...,NaT,NaT,NaT,,,,,,,
293819,PNTM-7015314831,,,7015314831,,no notificado índice,Sin Datos,NaT,Sin Datos,Sin Datos,...,NaT,NaT,NaT,,,,,,,


In [48]:
df_seguimiento_clean['nfolio_caso_indice'].value_counts()

12436348    39
13041090    33
12763425    33
12607339    33
12834928    33
            ..
15176689     1
14918644     1
20266121     1
14279159     1
20402193     1
Name: nfolio_caso_indice, Length: 15881, dtype: int64

In [49]:
#Se consideran solo los visible no eliniminados y se botan duplicados

df_seguimiento_clean= df_seguimiento_clean[df_seguimiento_clean['visible_no_eliminado']=='t'].drop_duplicates()


In [50]:
df_seguimiento_clean['nfolio_caso_indice'].value_counts()

15506064    22
19425664    22
13041090    22
18087089    21
13616788    21
            ..
19178318     1
16187553     1
14811845     1
19668141     1
17135632     1
Name: nfolio_caso_indice, Length: 15717, dtype: int64

# Indicador 5: Oportunidad en la investigación epidemiológica de casos

## Objetivo: Fortalecer la investigación epidemiológica de los casos

### Meta: >90%

**Periodicidad:** Semanal

**Escala Territorial:** Comunal, Regional, Nacional

**Fuente de Información:** Base EPIVIGILIA actualizada con los reportes de laboratorio al día de la determinación del indicador. Base de seguimiento

### Cálculo del indicador a nivel comunal

$\frac{No.\:casos\:nuevos\:registrados\:investigados\:dentro\:de\:48\:hrs\:por\:comuna\:1er\:establecimiento,\:semana\:x}{No.\:casos\:nuevos\:registrados\:por\:comuna\:1er\:establecimiento\:semana\:x}x100$

### Cálculo del indicador a nivel regional

$\frac{No.\:casos\:nuevos\:registrados\:investigados\:dentro\:de\:48\:hrs\:por\:región\:1er\:establecimiento,\:semana\:x}{No.\:casos\:nuevos\:registrados\:por\:región\:1er\:establecimiento\:semana\:x}x100$

**Observación**

- No se incluyen los casos nuevos no notificados
- Se considera un caso nuevo registrado a aquel caso notificado que cumple los requisitos para estar en el modulo de seguimiento
- La fecha para determinar el *inicio de seguimiento* corresponde a la **fecha de resultado (caso confirmado)** o **fecha de notificación (caso probable)**. Para un caso confirmado, si el resultado del test es anterior a la fecha de notificación, se debe iniciar seguimiento a partir de la fecha en que el registro está disponible en la bandeja de seguimiento.
- Se cumple el indicador si, dentro de las 48 hrs. a partir de la fecha de inicio de seguimiento se tiene al menos una actividad de seguimiento exitosa (se logra ubicar al caso).
- El primer establecimiento corresponde al establecimiento dado por API FONASA. Si el registro no hace match con API FONASA, se considera el establecimiento de notificación.
- Se consideran sólo registros de casos que estén activos o egresados en la bandeja de seguimiento.

In [51]:
df_seguimiento_clean['fecha_creacion'] #casos nuevos registrados

0        2021-03-01 11:46:59.255357
1        2021-03-22 12:49:44.051748
2        2021-03-25 18:23:53.976693
3        2021-03-29 17:55:07.453245
4        2021-04-03 13:40:31.874120
                    ...            
293816   2021-08-17 12:10:55.321584
293817   2021-08-16 00:32:44.242543
293818   2021-08-05 00:32:25.801614
293819   2021-08-01 00:32:32.553682
293820   2021-08-19 00:33:56.129119
Name: fecha_creacion, Length: 177558, dtype: datetime64[ns]

In [52]:

#Se consideran sólo registros de casos que estén activos o egresados en la bandeja de seguimiento.

df_seguimiento_ind5= df_seguimiento_clean[(df_seguimiento_clean['suspendido']=='activo')|(df_seguimiento_clean['suspendido']=='egresado')]

df_seguimiento_ind5.sample(2)

Unnamed: 0,n_folio,nfolio_caso,nfolio_caso_indice,nfolio_pntm,nfolio_contacto_estrecho,tipo_seguimiento,dia_contacto,fecha_notificacion,nombre_institucion_indice,region_institucion_indice,...,fecha_resultado_pcr_1,fecha_resultado_pcr_2,fecha_resultado_pcr_3,comuna_seremi_xi,provincia_seremi_xi,edad,sexo,pop_hombres,pop_mujeres,pop_total
115873,SC11062524-13436321,,13436321,,11062524,contacto,2021-04-27 00:00:00,2021-04-18,Hospital de Puerto Aysén,11,...,NaT,2021-04-19,NaT,Aysen,Aysen,39.0,hombre,12719.0,11240.0,23959.0
41697,SC10053509-11887274,,11887274,,10053509,contacto,2021-03-29 00:00:00,2021-03-28,SAPU Dr. Alejandro Gutiérrez,11,...,2021-03-29,NaT,NaT,Coyhaique,Coyhaique,55.0,hombre,28763.0,29055.0,57818.0


In [53]:
df_seguimiento_ind5[['suspendido', 'etapa_clinica', 'visible_no_eliminado','resultado_pcr_1','resultado_pcr_2','resultado_pcr_3']]

Unnamed: 0,suspendido,etapa_clinica,visible_no_eliminado,resultado_pcr_1,resultado_pcr_2,resultado_pcr_3
0,egresado,CONFIRMADA,t,POSITIVO,POSITIVO,
1,egresado,CONFIRMADA,t,POSITIVO,POSITIVO,
2,egresado,CONFIRMADA,t,,,
3,egresado,CONFIRMADA,t,POSITIVO,,
4,egresado,PROBABLE,t,,,
...,...,...,...,...,...,...
293816,egresado,CONFIRMADA,t,POSITIVO,POSITIVO,
293817,egresado,,t,,,
293818,egresado,,t,,,
293819,egresado,,t,,,


In [54]:
# Aún existen casos con 'etapa_clinica' DESCARTADA y SOSPECHA 

df_seguimiento_ind5.etapa_clinica.value_counts()

CONFIRMADA    82340
PROBABLE       9364
DESCARTADA      475
SOSPECHA         43
Name: etapa_clinica, dtype: int64

In [55]:

df_seguimiento_ind5[df_seguimiento_ind5['etapa_clinica']=='CONFIRMADA'][
    ['etapa_clinica',
     'tipo_seguimiento',
     'fecha_cumple_requisitos', 
     'fecha_notificacion',
     'fecha_resultado_pcr_1',
     'fecha_resultado_pcr_2',
     'fecha_resultado_pcr_3']
]

Unnamed: 0,etapa_clinica,tipo_seguimiento,fecha_cumple_requisitos,fecha_notificacion,fecha_resultado_pcr_1,fecha_resultado_pcr_2,fecha_resultado_pcr_3
0,CONFIRMADA,caso,2021-03-01,2021-03-01,2021-03-02,2021-03-26,NaT
1,CONFIRMADA,contacto,2021-03-22,2021-03-20,2021-03-22,2021-03-21,NaT
2,CONFIRMADA,contacto,2021-03-25,2021-03-23,NaT,NaT,NaT
3,CONFIRMADA,contacto,2021-03-29,2021-03-29,2021-03-31,NaT,NaT
5,CONFIRMADA,contacto,2021-04-05,2021-04-05,NaT,NaT,NaT
...,...,...,...,...,...,...,...
293805,CONFIRMADA,contacto,2021-08-14,2021-08-12,2021-08-14,2021-06-05,NaT
293806,CONFIRMADA,contacto,2021-08-17,2021-08-15,2021-08-16,2021-08-19,NaT
293807,CONFIRMADA,contacto,2021-08-19,2021-08-17,NaT,NaT,NaT
293815,CONFIRMADA,contacto,2021-08-18,2021-08-16,2021-08-17,2021-08-19,NaT


In [56]:
# Elimina etapa_clinica DESCARTADA y SOSPECHA
df_seguimiento_ind5 = df_seguimiento_ind5[(df_seguimiento_ind5['etapa_clinica']!='DESCARTADA')|(df_seguimiento_ind5['etapa_clinica']!='SOSPECHA')]

In [57]:
# Toma en cuenta solo el primer contacto con el contacto o caso

df_seguimiento_ind5= df_seguimiento_ind5.sort_values(by=['n_folio', 'dia_contacto']).groupby('n_folio').head(1)

In [58]:
#Crea diferencia de fecha
df_seguimiento_ind5['dif_fecha'] = df_seguimiento_ind5['fecha_cumple_requisitos'] - df_seguimiento_ind5['fecha_notificacion']

In [59]:
# Crea columna considerando si diferencial de fecha cumple requisitos y fecha de notificacion
# es menor a un timedelta de d 2 días

df_seguimiento_ind5['ind5'] = df_seguimiento_ind5['dif_fecha']<= pd.to_timedelta('2 days')

In [60]:
df_seguimiento_ind5[['fecha_creacion',
                       'fecha_notificacion', 
                       'fecha_cumple_requisitos', #Se considera un caso nuevo registrado a aquel caso notificado que cumple los requisitos para estar en el modulo de seguimiento
                       'fecha_derivacion_toma_muestra',
                       'cont_fecha_seguimiento',
                       'cont_inicio_cuarentena',
                       'cont_fin_cuarentena',
                       'cont_fecha_licencia',
                       'dif_fecha'
                      ]].sample(4)

Unnamed: 0,fecha_creacion,fecha_notificacion,fecha_cumple_requisitos,fecha_derivacion_toma_muestra,cont_fecha_seguimiento,cont_inicio_cuarentena,cont_fin_cuarentena,cont_fecha_licencia,dif_fecha
108700,2021-05-04 18:16:19.129230,2021-05-04,2021-05-04,Sin Datos,Sin Datos,2021-05-04 00:00:00,Sin Datos,Sin Datos,0 days
25407,2021-03-23 16:28:45.541674,2021-03-23,2021-03-23,Sin Datos,Sin Datos,2021-03-23 00:00:00,2021-04-05 00:00:00,Sin Datos,0 days
28451,2021-04-12 20:50:16.782822,2021-04-12,2021-04-12,Sin Datos,Sin Datos,2021-04-12 00:00:00,2021-04-25 00:00:00,Sin Datos,0 days
216141,2021-06-04 15:13:20.741144,2021-06-03,2021-06-04,Sin Datos,Sin Datos,2021-05-30 00:00:00,2021-06-12 00:00:00,Sin Datos,1 days


In [61]:
df_seguimiento_ind5.groupby(['fecha_cumple_requisitos', 'ind5']).count()[['n_folio']].reset_index()

Unnamed: 0,fecha_cumple_requisitos,ind5,n_folio
0,2021-03-01,True,27
1,2021-03-02,True,62
2,2021-03-03,True,56
3,2021-03-04,False,6
4,2021-03-04,True,33
...,...,...,...
339,2021-08-27,True,13
340,2021-08-28,True,6
341,2021-08-29,True,20
342,2021-08-30,True,82


In [573]:
# Crea gráfico de etapa_clinica regional por semana epidemiologica

px.bar(df_seguimiento_ind5.groupby(['fecha_cumple_requisitos', 'ind5']).count()[['n_folio']].reset_index(),
        x= 'fecha_cumple_requisitos',
        y= 'n_folio',
        color= 'ind5',
        color_discrete_map={
            True: '#750D86',
            False: '#EB663B',#rgb(222,203,228)#C075A6
            
          },
        labels={'ind5':'Cumple'}, 
       ).update_layout(title= 'Casos de la Región de Aysén diferenciados por etapa clínica',
                    yaxis_title='Número de casos',
                    xaxis_title='Semana epidemiológica',
                    template='simple_white',    ).update_traces(marker_line_color='rgb(0,0,0)',
                                      marker_line_width=0.1, 
                                      opacity=0.8
                                     )                     
                    #xaxis=dict(tickmode = 'array',
                     #             tickvals = list(range(12,88,3)),
                      #            ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                      #           ),
               #     ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                #               ).add_vrect(x0='50', x1='50', 
                 #                          annotation_text='2020', 
                  #                         annotation_position='top right',
                   #                        annotation=dict(font_size=18, 
                    #                                       font_family="'Open Sans', verdana, arial, sans-serif"),
                     #                                      opacity=0, 
                      #                                     line_width=0
                       #                   ).add_vrect(x0='84', x1='86', 
                        #                   annotation_text='2021', 
                         #                  annotation_position='top right',
                          #                 annotation=dict(font_size=18, 
                           #                                font_family="'Open Sans', verdana, arial, sans-serif"),
                            #                               opacity=0, 
                             #                              line_width=0)  
                      

In [63]:
df_ind5= df_seguimiento_ind5.groupby(['fecha_cumple_requisitos', 'ind5']).count()[['n_folio']].reset_index()

In [64]:
df_ind5_perc = (df_ind5[df_ind5['ind5']==True].set_index('fecha_cumple_requisitos')[['n_folio']]/df_ind5.groupby('fecha_cumple_requisitos').sum('n_folio')[['n_folio']])*100

In [65]:
px.scatter(df_ind5_perc.reset_index(),
        x= 'fecha_cumple_requisitos',
        y= 'n_folio',
        color='n_folio',
        color_continuous_scale=px.colors.sequential.Viridis_r,
        labels={'n_folio':'Oportunidad (%)'},
        ).update_layout(title= 'Oportunidad en la investigación epidemiológica de casos',
                       yaxis_title='Oportunidad (%)',
                       xaxis_title='Fecha',
                       template='simple_white',
                 #      xaxis=dict(tickmode = 'array',
                  #                tickvals = list(range(12,88,3)),
                   #               ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                    #             ),
                 #   ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                  #             ).add_hline(y=10, 
                   #                        line_width=3, 
                    #                       line_dash='longdash', 
                     #                      line_color='olive',
                      #                     annotation_text='Meta nacional (10%)',
                       #                    annotation_position='bottom right'
                        #         ).add_hline(y=mean_bac_ind, 
                         #                    line_width=3, 
                          #                   line_dash='longdash', 
                           #                  line_color='green',
                            #                 annotation_text= 'Promedio BAC ('+str(mean_bac_ind)+'%)',
                             #                annotation_position='bottom right'
                              #       ).add_vrect(x0='51', x1='50', 
                               #            annotation_text='2020', 
                                #           annotation_position='top right',
                                 #          annotation=dict(font_size=18, 
                                  #                         font_family="'Open Sans', verdana, arial, sans-serif"),
                                   #                        opacity=0, 
                                    #                       line_width=0
                                     #     ).add_vrect(x0='84', x1='86', 
                                      #     annotation_text='2021', 
                                       #    annotation_position='top right',
                                        #   annotation=dict(font_size=18, 
                                         #                  font_family="'Open Sans', verdana, arial, sans-serif"),
                                          #                 opacity=0, 
                                           #                line_width=0
                                                     ).update_traces(mode='lines+markers', 
                                                                     line_color='grey',
                                                                     marker_line_width=1, 
                                                                     marker_size=10)

In [66]:
df_ind5_perc.reset_index().head()

Unnamed: 0,fecha_cumple_requisitos,n_folio
0,2021-03-01,100.0
1,2021-03-02,100.0
2,2021-03-03,100.0
3,2021-03-04,84.615385
4,2021-03-05,83.050847


In [67]:
data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']]

Unnamed: 0,fecha_notificacion,semana_epidemiologica_21
0,2020-03-12,11
1,2020-03-12,11
2,2020-03-12,11
3,2020-03-18,12
4,2020-03-19,12
...,...,...
151482,2021-09-04,89
151483,2021-09-04,89
151484,2021-09-04,89
151485,2021-09-05,89


In [68]:
df_ind5_perc.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean()

Unnamed: 0_level_0,n_folio
semana_epidemiologica_21,Unnamed: 1_level_1
62,92.960749
63,71.688138
64,68.519817
65,84.958797
66,84.49241
67,87.880471
68,85.364546
69,88.157462
70,91.361851
71,84.418695


In [69]:
mean_ind5 = df_ind5_perc.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean()['n_folio'].mean()

In [70]:
px.scatter(df_ind5_perc.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean().reset_index(),
        x= 'semana_epidemiologica_21',
        y= 'n_folio',
        #trendline='rolling',
        #trendline_options=dict(window=5),
        color='n_folio',
        color_continuous_scale=px.colors.sequential.Viridis_r,
        labels={'n_folio':'Oportunidad (%)'},
        ).update_layout(title= 'Ind5: Oportunidad en la investigación epidemiológica de casos',
                       yaxis_title='Oportunidad (%)',
                       xaxis_title='Semana epidemiológica',
                       yaxis_range= [50,105],
                       template='simple_white',
                       xaxis=dict(tickmode = 'array',
                                  tickvals = list(range(12,88,3)),
                                  ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                                 ),
                    ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                              ).add_hline(y=90,
                                            line_width=3, 
                                            line_dash='longdash', 
                                            line_color='#222A2A',
                                            annotation_text='Meta (90%)',
                                            annotation_position='bottom right'
                                # ).add_hline(y=mean_ind5, 
                                 #            line_width=3, 
                                  #           line_dash='longdash', 
                                   #          line_color='#0D2A63',
                                    #         annotation_text= 'Promedio ('+str(round(mean_ind5, 2))+'%)',
                                     #        annotation_position='bottom right'
                                     ).add_vrect(x0='51', x1='53', 
                                           annotation_text='2020', 
                                           annotation_position='inside right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                          ).add_vrect(x0='84', x1='88', 
                                           annotation_text='2021', 
                                           annotation_position='inside right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                                     ).update_traces(mode='lines+markers', 
                                                                     line_color='grey',
                                                                     marker_line_width=1, 
                                                                     marker_size=10)

# Indicador 6: Capacidad de investigación de contactos

## Objetivos: Fortalecer la investigación epidemiológica de los contactos estrechos

### Meta: >80%

**Periodicidad:** Semanal

**Escala territorial:** Comuna, Regional, Nacional

**Fuente de información:** base EPIVIGILA actualizada con los reportes de laboratorio al día de la determinación del indicador. Base de seguimiento

**Cálculo del indicador a nivel comunal**

$\frac{No.\:casos\:nuevos\:con\:contactos\:estrechos\:por\:comuna\:1er\:establecimiento\:semana\:x}{No.\:casos\:nuevos\:por\:comuna\:1er\:establecimiento\:semana\:x}$

**Cálculo del indicador a nivel regional**

$\frac{No.\:casos\:nuevos\:con\:contactos\:estrechos\:por\:región\:1er\:establecimiento\:semana\:x}{No.\:casos\:nuevos\:por\:región\:1er\:establecimiento\:semana\:x}$

**Observaciones**

- No se incluyen los casos nuevos no notificados
- Se considera un caso nuevo registrado a aquel caso nuevo notificado que cumple los requisitos para estar en el módulo de seguimiento
- Los casos nuevos con contactos estrechos son considerados de forma dicotómica (sí o no)
- El primer establecimiento corresponde al establecimiento de notificación. Se seguirá considerando el primer establecimiento para este indicador, aún si se derivó previo a la investigación epidemiológica.
- Se consideran sólo registros activos o egresados en la bandeja de seguimiento

In [71]:
df_seguimiento_ind6 = df_seguimiento_clean

In [72]:
df_seguimiento_ind6['is_contact']= df_seguimiento_ind6['nfolio_contacto_estrecho'].notna()

In [565]:
# Crea una lista con casos indice

casos_indice = df_seguimiento_ind6[df_seguimiento_ind6['nfolio_caso_indice'].notna()]['nfolio_caso_indice'].drop_duplicates().astype('float64').to_list()



In [74]:
# Revisa si un caso es caso indice

df_seguimiento_ind6['is_index'] = df_seguimiento_ind6['nfolio_caso'].isin(casos_indice)

In [75]:
# Crea columna para mostrando si es o caso indice o contacto estrecho

df_seguimiento_ind6['is_index_or_contact'] = df_seguimiento_ind6['is_index'] | df_seguimiento_ind6['is_contact']

In [76]:
df_seguimiento_ind6['is_index_or_contact'].value_counts()

False    119668
True      57890
Name: is_index_or_contact, dtype: int64

In [77]:
df_seguimiento_ind6_clean = df_seguimiento_ind6[(df_seguimiento_ind6['suspendido']=='activo')|(df_seguimiento_ind6['suspendido']=='egresado')]

In [78]:
# Elimina etapa_clinica DESCARTADA y SOSPECHA
df_seguimiento_ind6_clean = df_seguimiento_ind6_clean[(df_seguimiento_ind6_clean['etapa_clinica']!='DESCARTADA')|(df_seguimiento_ind6_clean['etapa_clinica']!='SOSPECHA')]

In [79]:
df_seguimiento_ind6_clean['nfolio_caso_indice'].value_counts()

13041090    22
15506064    22
19425664    22
15572891    21
18087089    21
            ..
16864082     1
15459722     1
14224072     1
13760735     1
17135632     1
Name: nfolio_caso_indice, Length: 13080, dtype: int64

In [80]:
df_seguimiento_ind6_clean.head(1)

Unnamed: 0,n_folio,nfolio_caso,nfolio_caso_indice,nfolio_pntm,nfolio_contacto_estrecho,tipo_seguimiento,dia_contacto,fecha_notificacion,nombre_institucion_indice,region_institucion_indice,...,comuna_seremi_xi,provincia_seremi_xi,edad,sexo,pop_hombres,pop_mujeres,pop_total,is_contact,is_index,is_index_or_contact
0,8753781,8753781.0,,,,caso,2021-03-02 00:00:00,2021-03-01,Hospital Regional (Coihaique),11,...,Coyhaique,Coyhaique,47.0,hombre,28763.0,29055.0,57818.0,False,False,False


In [81]:
# Toma en cuenta solo el primer contacto con el contacto o caso

df_seguimiento_ind6_clean= df_seguimiento_ind6_clean.sort_values(by=['n_folio', 'dia_contacto']).groupby('n_folio').head(1)

In [82]:
df_seguimiento_ind6_clean.groupby(['fecha_cumple_requisitos', 'is_index_or_contact']).count()[['n_folio']].reset_index()

Unnamed: 0,fecha_cumple_requisitos,is_index_or_contact,n_folio
0,2021-03-01,False,14
1,2021-03-01,True,13
2,2021-03-02,False,21
3,2021-03-02,True,41
4,2021-03-03,False,10
...,...,...,...
361,2021-08-29,False,5
362,2021-08-29,True,15
363,2021-08-30,False,78
364,2021-08-30,True,4


In [562]:
# Crea gráfico de etapa_clinica regional por semana epidemiologica

px.bar(df_seguimiento_ind6_clean.groupby(['fecha_cumple_requisitos', 'is_index_or_contact']).count()[['n_folio']].reset_index(),
        x= 'fecha_cumple_requisitos',
        y= 'n_folio',
        color= 'is_index_or_contact',
        color_discrete_map={
            True: 'rgb(136,204,238)',
            False: 'rgb(204,102,119)',#rgb(222,203,228)#C075A6
            
          },
        labels={'is_index_or_contact':'Contacto'}, 
       ).update_layout(title= 'Casos de la Región de Aysén con contactos estrechos',
                    yaxis_title='Número de casos',
                    xaxis_title='Fecha',
                    template='simple_white',
                      
                      ).update_traces(marker_line_color='rgb(0,0,0)',
                                      marker_line_width=0.1, 
                                      #opacity=1
                                     )                
                    #xaxis=dict(tickmode = 'array',
                     #             tickvals = list(range(12,88,3)),
                      #            ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                      #           ),
               #     ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                #               ).add_vrect(x0='50', x1='50', 
                 #                          annotation_text='2020', 
                  #                         annotation_position='top right',
                   #                        annotation=dict(font_size=18, 
                    #                                       font_family="'Open Sans', verdana, arial, sans-serif"),
                     #                                      opacity=0, 
                      #                                     line_width=0
                       #                   ).add_vrect(x0='84', x1='86', 
                        #                   annotation_text='2021', 
                         #                  annotation_position='top right',
                          #                 annotation=dict(font_size=18, 
                           #                                font_family="'Open Sans', verdana, arial, sans-serif"),
                            #                               opacity=0, 
                             #                              line_width=0)  
                      

In [84]:
df_ind6= df_seguimiento_ind6_clean.groupby(['fecha_cumple_requisitos', 'is_index_or_contact']).count()[['n_folio']].reset_index()

In [85]:
df_ind6_perc = (df_ind6[df_ind6['is_index_or_contact']==True].set_index('fecha_cumple_requisitos')[['n_folio']]/df_ind6.groupby('fecha_cumple_requisitos').sum('n_folio')[['n_folio']])*100

In [86]:
px.scatter(df_ind6_perc.reset_index(),
        x= 'fecha_cumple_requisitos',
        y= 'n_folio',
        color='n_folio',
        color_continuous_scale=px.colors.sequential.Magma_r,
        labels={'n_folio':'Oportunidad (%)'},
        ).update_layout(title= 'Capacidad de investigación de contactos estrechos',
                       yaxis_title='Oportunidad (%)',
                       xaxis_title='Fecha',
                       template='simple_white',
                 #      xaxis=dict(tickmode = 'array',
                  #                tickvals = list(range(12,88,3)),
                   #               ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                    #             ),
                 #   ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                  #             ).add_hline(y=10, 
                   #                        line_width=3, 
                    #                       line_dash='longdash', 
                     #                      line_color='olive',
                      #                     annotation_text='Meta nacional (10%)',
                       #                    annotation_position='bottom right'
                        #         ).add_hline(y=mean_bac_ind, 
                         #                    line_width=3, 
                          #                   line_dash='longdash', 
                           #                  line_color='green',
                            #                 annotation_text= 'Promedio BAC ('+str(mean_bac_ind)+'%)',
                             #                annotation_position='bottom right'
                              #       ).add_vrect(x0='51', x1='50', 
                               #            annotation_text='2020', 
                                #           annotation_position='top right',
                                 #          annotation=dict(font_size=18, 
                                  #                         font_family="'Open Sans', verdana, arial, sans-serif"),
                                   #                        opacity=0, 
                                    #                       line_width=0
                                     #     ).add_vrect(x0='84', x1='86', 
                                      #     annotation_text='2021', 
                                       #    annotation_position='top right',
                                        #   annotation=dict(font_size=18, 
                                         #                  font_family="'Open Sans', verdana, arial, sans-serif"),
                                          #                 opacity=0, 
                                           #                line_width=0
                                                     ).update_traces(mode='lines+markers', 
                                                                     line_color='grey',
                                                                     marker_line_width=1, 
                                                                     marker_size=10)

In [87]:
mean_ind6 = df_ind6_perc.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean()['n_folio'].mean()

In [88]:
px.scatter(df_ind6_perc.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean().reset_index(),
        x= 'semana_epidemiologica_21',
        y= 'n_folio',
        #trendline='rolling',
        #trendline_options=dict(window=5),
        color='n_folio',
        color_continuous_scale=px.colors.sequential.Magma_r,
        labels={'n_folio':'Oportunidad (%)'},
        ).update_layout(title= 'Ind6: Capacidad de investigación de contactos',
                       yaxis_title='Oportunidad (%)',
                       xaxis_title='Semana epidemiológica',
                       yaxis_range= [0,100],
                       template='simple_white',
                       xaxis=dict(tickmode = 'array',
                                  tickvals = list(range(12,88,3)),
                                  ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                                 ),
                    ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                              ).add_hline(y=80,
                                            line_width=3, 
                                            line_dash='longdash', 
                                            line_color='#222A2A',
                                            annotation_text='Meta (80%)',
                                            annotation_position='bottom right'
                                 ).add_hline(y=mean_ind6, 
                                             line_width=3, 
                                             line_dash='longdash', 
                                             line_color='#750D86',
                                             annotation_text= 'Promedio ('+str(round(mean_ind6, 2))+'%)',
                                             annotation_position='bottom right'
                                     ).add_vrect(x0='51', x1='53', 
                                           annotation_text='2020', 
                                           annotation_position='top right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                          ).add_vrect(x0='84', x1='88', 
                                           annotation_text='2021', 
                                           annotation_position='top right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                                     ).update_traces(mode='lines+markers', 
                                                                     line_color='grey',
                                                                     marker_line_width=1, 
                                                                     marker_size=10)

# Indicador 7: Capacidad de investigación de contactos en 48h


## Objetivo: Evaluar la capacidad de seguimiento de contactos

### Meta: >80%

**Periodicidad:** Semanal

**Escala territorial:** Comuna, Regional, Nacional

**Fuente de información:** base EPIVIGILA actualizada con los reportes de laboratorio al día de la determinación del indicador. Base de seguimiento.

**Cálculo del indicador a nivel comunal**

$\frac{No.\:contactos\:identificados\:investigados\:dentro\:de\:48hrs\:por\:comuna\:1er\:establecimiento\:semana\:x}{No.\:contactos\:identificados\:por\:comuna\:1er\:establecimiento\:semana\:x}x100$

**Cálculo del indicador a nivel regional**

$\frac{No.\:contactos\:identificados\:investigados\:dentro\:de\:48hrs\:por\:región\:1er\:establecimiento\:semana\:x}{No.\:contactos\:identificados\:por\:región\:1er\:establecimiento\:semana\:x}x100$

**Observaciones**

- No se incluyen los contactos nuevos no notificados
- Se considera como registro de contacto aquel que cumple las condiciones para estar en la bandeja de seguimiento
- Se consideran sólo registros de casos activos o egresados en la bandeja de seguimiento
- El primer establecimiento corresponde al establecimiento dado por API FONASA. Si el registro no hace match con API FONASA, se considera el establecimiento para este indicador, aún si se derivó previo a la investigación epidemiológica

In [89]:
df_seguimiento_ind7 = df_seguimiento_clean

In [90]:
df_seguimiento_ind7= df_seguimiento_ind7[df_seguimiento_ind7['nfolio_contacto_estrecho'].notna()]#[['fecha_cumple_requisitos','dia_contacto']]

In [91]:
# Filtra contactos que hayan sido localizados

df_seguimiento_ind7 = df_seguimiento_ind7[df_seguimiento_ind7['contacto_localizado']=='t']

In [92]:
# Se consideran sólo registros de casos activos o egresados
df_seguimiento_ind7_clean = df_seguimiento_ind7[(df_seguimiento_ind7['suspendido']=='activo')|(df_seguimiento_ind7['suspendido']=='egresado')]

In [93]:
df_seguimiento_ind7_clean = df_seguimiento_ind7_clean[df_seguimiento_ind7_clean['cont_estado_seguimiento']!='Aún no contactado']

In [94]:
df_seguimiento_ind7_clean = df_seguimiento_ind7_clean[df_seguimiento_ind7_clean['cont_inicio_cuarentena'].notna()]

In [95]:
df_seguimiento_ind7_clean= df_seguimiento_ind7_clean.sort_values(by=['n_folio', 'dia_contacto']).groupby('n_folio').head(1)

In [96]:
df_seguimiento_ind7_clean['dif_intervalo'] = pd.to_datetime(df_seguimiento_ind7_clean['fecha_cumple_requisitos']) - pd.to_datetime(df_seguimiento_ind7_clean['dia_contacto'])

In [97]:
df_seguimiento_ind7_clean['dif_intervalo'].value_counts()

0 days      11650
-1 days       304
-2 days       149
1 days        136
-3 days        88
-4 days        59
-5 days        55
3 days         40
2 days         22
-6 days        18
-7 days        13
-8 days        12
7 days         10
13 days         9
5 days          8
15 days         7
-13 days        5
27 days         3
6 days          3
29 days         3
-9 days         2
33 days         2
-10 days        2
28 days         1
8 days          1
4 days          1
16 days         1
-11 days        1
14 days         1
17 days         1
37 days         1
Name: dif_intervalo, dtype: int64

In [98]:
df_seguimiento_ind7_clean['dif_ind7'] = (df_seguimiento_ind7_clean['dif_intervalo'] <= pd.to_timedelta('2 days'))#| (df_seguimiento_ind7_clean['dif_intervalo'] == pd.to_timedelta('-1 days'))|(df_seguimiento_ind7_clean['dif_intervalo'] == pd.to_timedelta('0 days'))

In [99]:
df_seguimiento_ind7_clean['dif_ind7']

28191    True
37474    True
31378    True
32631    True
33965    True
         ... 
40617    True
38305    True
31220    True
30743    True
37593    True
Name: dif_ind7, Length: 12608, dtype: bool

In [100]:
df_seguimiento_ind7_clean.groupby(['fecha_cumple_requisitos','dif_ind7']).count()[['n_folio']].reset_index()

Unnamed: 0,fecha_cumple_requisitos,dif_ind7,n_folio
0,2021-03-01,True,13
1,2021-03-02,True,39
2,2021-03-03,True,46
3,2021-03-04,False,3
4,2021-03-04,True,24
...,...,...,...
205,2021-08-26,True,3
206,2021-08-27,True,5
207,2021-08-28,True,2
208,2021-08-29,True,15


In [553]:
# Crea gráfico de etapa_clinica regional por semana epidemiologica

px.bar(df_seguimiento_ind7_clean.groupby(['fecha_cumple_requisitos','dif_ind7']).count()[['n_folio']].reset_index(),
        x= 'fecha_cumple_requisitos',
        y= 'n_folio',
        color= 'dif_ind7',
        color_discrete_map={
            True: 'rgb(0,134,149)',
            False: 'rgb(207,28,144)'#rgb(222,203,228)#C075A6
          },
        labels={'dif_ind7':'Cumplido'}, 
       ).update_layout(title= 'Capacidad de investigación de contactos en 48h',
                    yaxis_title='Número de casos',
                    xaxis_title='Fecha',
                    template='simple_white',
                      ).update_traces(marker_line_color='rgb(0,0,0)',
                                      marker_line_width=0.1, 
                                      #opacity=0.8
                                     )                  
                    #xaxis=dict(tickmode = 'array',
                     #             tickvals = list(range(12,88,3)),
                      #            ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                      #           ),
               #     ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                #               ).add_vrect(x0='50', x1='50', 
                 #                          annotation_text='2020', 
                  #                         annotation_position='top right',
                   #                        annotation=dict(font_size=18, 
                    #                                       font_family="'Open Sans', verdana, arial, sans-serif"),
                     #                                      opacity=0, 
                      #                                     line_width=0
                       #                   ).add_vrect(x0='84', x1='86', 
                        #                   annotation_text='2021', 
                         #                  annotation_position='top right',
                          #                 annotation=dict(font_size=18, 
                           #                                font_family="'Open Sans', verdana, arial, sans-serif"),
                            #                               opacity=0, 
                             #                              line_width=0)  
                      

In [102]:
df_ind7= df_seguimiento_ind7_clean.groupby(['fecha_cumple_requisitos', 'dif_ind7']).count()[['n_folio']].reset_index()

In [103]:
df_ind7_perc = (df_ind7[df_ind7['dif_ind7']==True].set_index('fecha_cumple_requisitos')[['n_folio']]/df_ind7.groupby('fecha_cumple_requisitos').sum('n_folio')[['n_folio']])*100

In [104]:
px.scatter(df_ind7_perc.reset_index(),
        x= 'fecha_cumple_requisitos',
        y= 'n_folio',
        color='n_folio',
        color_continuous_scale=px.colors.sequential.Mint,
        labels={'n_folio':'Oportunidad (%)'},
        ).update_layout(title= 'Capacidad de investigación de contactos en 48h',
                       yaxis_title='Oportunidad (%)',
                       xaxis_title='Fecha',
                       template='simple_white',
                 #      xaxis=dict(tickmode = 'array',
                  #                tickvals = list(range(12,88,3)),
                   #               ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                    #             ),
                 #   ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                  #             ).add_hline(y=10, 
                   #                        line_width=3, 
                    #                       line_dash='longdash', 
                     #                      line_color='olive',
                      #                     annotation_text='Meta nacional (10%)',
                       #                    annotation_position='bottom right'
                        #         ).add_hline(y=mean_bac_ind, 
                         #                    line_width=3, 
                          #                   line_dash='longdash', 
                           #                  line_color='green',
                            #                 annotation_text= 'Promedio BAC ('+str(mean_bac_ind)+'%)',
                             #                annotation_position='bottom right'
                              #       ).add_vrect(x0='51', x1='50', 
                               #            annotation_text='2020', 
                                #           annotation_position='top right',
                                 #          annotation=dict(font_size=18, 
                                  #                         font_family="'Open Sans', verdana, arial, sans-serif"),
                                   #                        opacity=0, 
                                    #                       line_width=0
                                     #     ).add_vrect(x0='84', x1='86', 
                                      #     annotation_text='2021', 
                                       #    annotation_position='top right',
                                        #   annotation=dict(font_size=18, 
                                         #                  font_family="'Open Sans', verdana, arial, sans-serif"),
                                          #                 opacity=0, 
                                           #                line_width=0
                                                     ).update_traces(mode='lines+markers', 
                                                                     line_color='grey',
                                                                     marker_line_width=1, 
                                                                     marker_size=10)

In [105]:
mean_ind7 = df_ind7_perc.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean()['n_folio'].mean()

In [507]:
px.scatter(df_ind7_perc.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean().reset_index(),
        x= 'semana_epidemiologica_21',
        y= 'n_folio',
        #trendline='rolling',
        #trendline_options=dict(window=5),
        color='n_folio',
        color_continuous_scale=px.colors.sequential.Mint,
        labels={'n_folio':'Oportunidad (%)'},
        ).update_layout(title= 'Ind7: Capacidad de investigación de contactos en 48h',
                       yaxis_title='Oportunidad (%)',
                       xaxis_title='Semana epidemiológica',
                       yaxis_range= [0,105],
                       template='simple_white',
                       xaxis=dict(tickmode = 'array',
                                  tickvals = list(range(12,88,3)),
                                  ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                                 ),
                    ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                              ).add_hline(y=80,
                                            line_width=3, 
                                            line_dash='longdash', 
                                            line_color='#222A2A',
                                            annotation_text='Meta (80%)',
                                            annotation_position='bottom left'
                                 ).add_hline(y=mean_ind7, 
                                             line_width=3, 
                                             line_dash='longdash', 
                                             line_color='#000000',
                                             annotation_text= 'Promedio ('+str(round(mean_ind7, 2))+'%)',
                                             annotation_position='bottom left'
                                     ).add_vrect(x0='51', x1='53', 
                                           annotation_text='2020', 
                                           annotation_position='bottom right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                          ).add_vrect(x0='84', x1='88', 
                                           annotation_text='2021', 
                                           annotation_position='bottom right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                                     ).update_traces(mode='lines+markers', 
                                                                     line_color='grey',
                                                                     marker_line_width=1, 
                                                                     marker_size=10)

# Indicador 8: Casos en seguimiento

## Objetivo: Evaluar la capacidad de seguimiento de casos

### Meta: >90%

**Periodicidad:** Semanal

**Escala territorial:** Comuna, Regional, Nacional

**Fuente de Información:** base EPIVIGILA actualizada con los reportes de laboratorio al día de la determinación del indicador. Base de seguimiento

### Cálculo del indicador a nivel comunal

$\frac{No.\:casos\:activos\:investigados\:con\:seguimiento\:según\:protocolo\:por\:comuna\:último\:establecimiento\:semana\:x}{No.\:casos\:nuevos\:registrados\:por\:comuna\:ultimo\:establecimiento\:semana\:x}x100$

### Cálculo del indicador a nivel regional

$\frac{No.\:casos\:activos\:investigados\:con\:seguimiento\:según\:protocolo\:por\:región\:último\:establecimiento\:semana\:x}{No.\:casos\:nuevos\:registrados\:por\:región\:ultimo\:establecimiento\:semana\:x}x100$

**Observación**

- No se incluyen los casos nuevos no notificados ("casos reportados por laboratorio")
- Se considera un caso activo como aquel caso notificado que cumple la definición de caso activo, con fecha de notificación en la semana de interés
- Se consideran sólo registros activos o egresados en la bandeja de seguimiento
- Según protocolo implica un seguimiento diario por día de seguimiento, desde el inicio de seguimiento y se valora de forma dicotómica (cumple o no cumple el protocolo de seguimiento)
- Por seguimiento diario se entiende que diariamente, se debe realizar una actividad de seguimiento (la cual puede ser exitosa o no)

In [309]:
df_seguimiento_ind8 = df_seguimiento_clean

In [310]:
# Se consideran sólo registros de casos activos o egresados
df_seguimiento_ind8_clean = df_seguimiento_ind8[(df_seguimiento_ind8['suspendido']=='activo')|(df_seguimiento_ind8['suspendido']=='egresado')]

In [311]:
#df_seguimiento_ind8_clean = df_seguimiento_ind8_clean[df_seguimiento_ind8_clean['cont_estado_seguimiento']!='Aún no contactado']

In [312]:
df_seguimiento_ind8_clean = df_seguimiento_ind8_clean[df_seguimiento_ind8_clean['cont_inicio_cuarentena'].notna()]

In [313]:
df_seguimiento_ind8_clean = df_seguimiento_ind8_clean[df_seguimiento_ind8_clean['tipo_seguimiento']=='caso']

In [314]:
df_seguimiento_ind8_clean['fecha_cumple_requisitos'] = pd.to_datetime(df_seguimiento_ind8_clean['fecha_cumple_requisitos'])

In [322]:
# Calcula No. de dias que un caso debiera ser contactado

df_seguimiento_ind8_clean['dif_needed'] =  pd.to_datetime(df_seguimiento_ind8_clean['cont_fin_cuarentena'], errors='coerce')-df_seguimiento_ind8_clean['fecha_cumple_requisitos']

df_seguimiento_ind8_clean['dif_needed'].sample(1)

255868   12 days
Name: dif_needed, dtype: timedelta64[ns]

In [328]:
df_seguimiento_ind8_clean.sort_values(by=['n_folio', 'dia_contacto'])[['n_folio','fecha_cumple_requisitos','cont_inicio_cuarentena','cont_fin_cuarentena','dia_contacto','fecha_notificacion']].sort_values(by=['n_folio', 'dia_contacto']).groupby('n_folio').head(1)

Unnamed: 0,n_folio,fecha_cumple_requisitos,cont_inicio_cuarentena,cont_fin_cuarentena,dia_contacto,fecha_notificacion
29092,10000195,2021-03-26,2021-03-25 00:00:00,2021-04-04 00:00:00,2021-03-28 00:00:00,2021-03-26
38009,10000424,2021-03-26,2021-03-25 00:00:00,2021-04-04 00:00:00,2021-03-28 00:00:00,2021-03-26
30056,10001180,2021-04-06,2021-03-26 00:00:00,2021-04-05 00:00:00,2021-03-27 00:00:00,2021-03-26
35486,10001222,2021-03-29,2021-03-26 00:00:00,2021-04-05 00:00:00,2021-03-29 00:00:00,2021-03-26
39308,10001597,2021-03-29,2021-03-26 00:00:00,2021-04-05 00:00:00,2021-03-28 00:00:00,2021-03-26
...,...,...,...,...,...,...
1611,9989269,2021-03-26,2021-03-14 00:00:00,2021-03-24 00:00:00,Sin Datos,2021-03-26
27174,9989432,2021-03-26,2021-03-25 00:00:00,2021-04-04 00:00:00,2021-03-26 00:00:00,2021-03-26
17273,9993204,2021-03-28,2021-03-26 00:00:00,2021-04-05 00:00:00,2021-03-28 00:00:00,2021-03-26
31556,9998918,2021-03-28,2021-03-26 00:00:00,2021-04-05 00:00:00,2021-03-28 00:00:00,2021-03-26


In [324]:
# Calcula No. de dias que un caso fue contactado

df_seguimiento_ind8_clean.sort_values(by=['n_folio', 'dia_contacto']).groupby('n_folio').count()[['nfolio_caso']]

Unnamed: 0_level_0,nfolio_caso
n_folio,Unnamed: 1_level_1
10000195,5
10000424,6
10001180,3
10001222,3
10001597,5
...,...
9989269,1
9989432,10
9993204,6
9998918,7


In [325]:
df_seguimiento_ind8_clean.sort_values(by=['n_folio'])[['n_folio','dif_needed']].groupby('n_folio').head(1)

Unnamed: 0,n_folio,dif_needed
29092,10000195,9 days
36804,10000424,9 days
30056,10001180,-1 days
35485,10001222,7 days
34509,10001597,7 days
...,...,...
1611,9989269,-2 days
27174,9989432,9 days
36899,9993204,8 days
36419,9998918,8 days


In [330]:
df_ind8= df_seguimiento_ind8_clean.sort_values(by=['n_folio'])[['n_folio','dif_needed']].groupby('n_folio').head(1).merge(
    df_seguimiento_ind8_clean.sort_values(by=['n_folio', 'dia_contacto']).groupby('n_folio').count()[['nfolio_caso']],
    how='left',
    left_on = 'n_folio',
    right_on = 'n_folio'
)

In [332]:
df_ind8.sample(3)

Unnamed: 0,n_folio,dif_needed,nfolio_caso
4637,14735946,9 days,5
1236,11952549,8 days,9
1563,12247644,9 days,10


In [353]:
# Transforma datos a formato Float64

df_ind8['nfolio_caso'] = df_ind8['nfolio_caso'].astype('float64')

df_ind8['dif_needed'] = df_ind8['dif_needed'].dt.days

In [355]:
df_ind8['goal_100'] = df_ind8['nfolio_caso'] >= df_ind8['dif_needed']

df_ind8['goal_80'] = df_ind8['nfolio_caso'] >= df_ind8['dif_needed']*0.8

df_ind8['goal_60'] = df_ind8['nfolio_caso'] >= df_ind8['dif_needed']*0.6

In [356]:
df_ind8

Unnamed: 0,n_folio,dif_needed,nfolio_caso,goal_100,goal_80,goal_60
0,10000195,9.0,5.0,False,False,False
1,10000424,9.0,6.0,False,False,True
2,10001180,-1.0,3.0,True,True,True
3,10001222,7.0,3.0,False,False,False
4,10001597,7.0,5.0,False,False,True
...,...,...,...,...,...,...
5526,9989269,-2.0,1.0,True,True,True
5527,9989432,9.0,10.0,True,True,True
5528,9993204,8.0,6.0,False,False,True
5529,9998918,8.0,7.0,False,True,True


In [365]:
# Realiza merge con df original

df_ind8_merged= df_ind8.merge(df_seguimiento_clean,
             how='inner',
             left_on ='n_folio',
             right_on='n_folio'
             ) 

In [372]:
df_ind8_merged_head = df_ind8_merged.sort_values(['n_folio', 'fecha_notificacion']).groupby('n_folio').head(1)

In [377]:
df_ind8_merged_head.groupby(['fecha_cumple_requisitos','goal_100']).count()

Unnamed: 0_level_0,Unnamed: 1_level_0,n_folio,dif_needed,nfolio_caso_x,goal_80,goal_60,nfolio_caso_y,nfolio_caso_indice,nfolio_pntm,nfolio_contacto_estrecho,tipo_seguimiento,...,comuna_seremi_xi,provincia_seremi_xi,edad,sexo,pop_hombres,pop_mujeres,pop_total,is_contact,is_index,is_index_or_contact
fecha_cumple_requisitos,goal_100,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1
2021-03-01,False,4,4,4,4,4,4,0,0,0,4,...,3,3,3,3,3,3,3,4,4,4
2021-03-01,True,10,10,10,10,10,10,0,0,0,10,...,10,10,10,10,4,4,4,10,10,10
2021-03-02,False,8,7,8,8,8,8,0,0,0,8,...,8,8,8,8,7,7,7,8,8,8
2021-03-02,True,13,13,13,13,13,13,0,0,0,13,...,13,13,13,13,12,12,12,13,13,13
2021-03-03,False,6,6,6,6,6,6,0,0,0,6,...,6,6,6,6,6,6,6,6,6,6
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2021-08-27,False,11,5,11,11,11,11,0,0,0,11,...,9,9,9,9,9,9,9,11,11,11
2021-08-28,False,4,1,4,4,4,4,0,0,0,4,...,2,2,2,2,2,2,2,4,4,4
2021-08-29,False,5,3,5,5,5,5,0,0,0,5,...,5,5,5,5,5,5,5,5,5,5
2021-08-30,False,78,9,78,78,78,78,0,0,0,78,...,74,74,75,75,74,74,74,78,78,78


In [548]:
# Crea gráfico de etapa_clinica regional por semana epidemiologica

px.bar(df_ind8_merged_head.groupby(['fecha_cumple_requisitos','goal_100']).count().reset_index(),
        x= 'fecha_cumple_requisitos',
        y= 'n_folio',
        color= 'goal_100',
        color_discrete_map={
            True: '#620042',
            False: 'rgb(222,203,228)'#rgb(222,203,228)#C075A6
          },
        labels={'goal_100':'Cumplido'}, 
       ).update_layout(title= 'Capacidad de seguimiento de casos',
                    yaxis_title='Número de casos seguidos diariamente',
                    xaxis_title='Fecha',
                    template='simple_white',
                      ).update_traces(marker_line_color='rgb(0,0,0)',
                                      marker_line_width=0.1, opacity=0.9)                  
                    #xaxis=dict(tickmode = 'array',
                     #             tickvals = list(range(12,88,3)),
                      #            ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                      #           ),
               #     ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                #               ).add_vrect(x0='50', x1='50', 
                 #                          annotation_text='2020', 
                  #                         annotation_position='top right',
                   #                        annotation=dict(font_size=18, 
                    #                                       font_family="'Open Sans', verdana, arial, sans-serif"),
                     #                                      opacity=0, 
                      #                                     line_width=0
                       #                   ).add_vrect(x0='84', x1='86', 
                        #                   annotation_text='2021', 
                         #                  annotation_position='top right',
                          #                 annotation=dict(font_size=18, 
                           #                                font_family="'Open Sans', verdana, arial, sans-serif"),
                            #                               opacity=0, 
                             #                              line_width=0)  
                      

In [547]:
# Crea gráfico de etapa_clinica regional por semana epidemiologica

px.bar(df_ind8_merged_head.groupby(['fecha_cumple_requisitos','goal_80']).count().reset_index(),
        x= 'fecha_cumple_requisitos',
        y= 'n_folio',
        color= 'goal_80',
        color_discrete_map={
            True: '#620042',
            False: 'rgb(222,203,228)'#rgb(222,203,228)#C075A6
          },
        labels={'goal_80':'Cumplido'}, 
       ).update_layout(title= 'Capacidad de seguimiento de casos',
                    yaxis_title='Número de casos',
                    xaxis_title='Fecha',
                    template='simple_white',
                      ).update_traces(marker_line_color='rgb(0,0,0)',
                                      marker_line_width=0.1, opacity=0.9)                 
                    #xaxis=dict(tickmode = 'array',
                     #             tickvals = list(range(12,88,3)),
                      #            ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                      #           ),
               #     ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                #               ).add_vrect(x0='50', x1='50', 
                 #                          annotation_text='2020', 
                  #                         annotation_position='top right',
                   #                        annotation=dict(font_size=18, 
                    #                                       font_family="'Open Sans', verdana, arial, sans-serif"),
                     #                                      opacity=0, 
                      #                                     line_width=0
                       #                   ).add_vrect(x0='84', x1='86', 
                        #                   annotation_text='2021', 
                         #                  annotation_position='top right',
                          #                 annotation=dict(font_size=18, 
                           #                                font_family="'Open Sans', verdana, arial, sans-serif"),
                            #                               opacity=0, 
                             #                              line_width=0)  
                      

In [549]:
# Crea gráfico de etapa_clinica regional por semana epidemiologica

px.bar(df_ind8_merged_head.groupby(['fecha_cumple_requisitos','goal_60']).count().reset_index(),
        x= 'fecha_cumple_requisitos',
        y= 'n_folio',
        color= 'goal_60',
        color_discrete_map={
            True: '#620042',
            False: 'rgb(222,203,228)'#rgb(222,203,228)#C075A6
          },
        labels={'goal_60':'Cumplido'}, 
       ).update_layout(title= 'Capacidad de seguimiento de casos',
                    yaxis_title='Número de casos',
                    xaxis_title='Fecha',
                    template='simple_white',
                      ).update_traces(marker_line_color='rgb(0,0,0)',
                                      marker_line_width=0.1, opacity=0.8)                 
                    #xaxis=dict(tickmode = 'array',
                     #             tickvals = list(range(12,88,3)),
                      #            ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                      #           ),
               #     ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                #               ).add_vrect(x0='50', x1='50', 
                 #                          annotation_text='2020', 
                  #                         annotation_position='top right',
                   #                        annotation=dict(font_size=18, 
                    #                                       font_family="'Open Sans', verdana, arial, sans-serif"),
                     #                                      opacity=0, 
                      #                                     line_width=0
                       #                   ).add_vrect(x0='84', x1='86', 
                        #                   annotation_text='2021', 
                         #                  annotation_position='top right',
                          #                 annotation=dict(font_size=18, 
                           #                                font_family="'Open Sans', verdana, arial, sans-serif"),
                            #                               opacity=0, 
                             #                              line_width=0)  
                      

In [389]:
df_ind8_100= df_ind8_merged_head.groupby(['fecha_cumple_requisitos','goal_100']).count()[['n_folio']].reset_index()

In [392]:
df_ind8_100

Unnamed: 0,fecha_cumple_requisitos,goal_100,n_folio
0,2021-03-01,False,4
1,2021-03-01,True,10
2,2021-03-02,False,8
3,2021-03-02,True,13
4,2021-03-03,False,6
...,...,...,...
341,2021-08-27,False,11
342,2021-08-28,False,4
343,2021-08-29,False,5
344,2021-08-30,False,78


In [390]:
df_ind8_80= df_ind8_merged_head.groupby(['fecha_cumple_requisitos','goal_80']).count()[['n_folio']].reset_index()

In [391]:
df_ind8_60= df_ind8_merged_head.groupby(['fecha_cumple_requisitos','goal_60']).count()[['n_folio']].reset_index()

In [396]:
df_ind8_perc100 = (df_ind8_100[df_ind8_100['goal_100']==True].set_index('fecha_cumple_requisitos')[['n_folio']]/df_ind8_100.groupby('fecha_cumple_requisitos').sum('n_folio')[['n_folio']])*100

In [397]:
df_ind8_perc80 = (df_ind8_80[df_ind8_80['goal_80']==True].set_index('fecha_cumple_requisitos')[['n_folio']]/df_ind8_80.groupby('fecha_cumple_requisitos').sum('n_folio')[['n_folio']])*100

In [398]:
df_ind8_perc60 = (df_ind8_60[df_ind8_60['goal_60']==True].set_index('fecha_cumple_requisitos')[['n_folio']]/df_ind8_60.groupby('fecha_cumple_requisitos').sum('n_folio')[['n_folio']])*100

In [437]:
px.scatter(df_ind8_perc100.reset_index(),
        x= 'fecha_cumple_requisitos',
        y= 'n_folio',
        color='n_folio',
        color_continuous_scale=px.colors.sequential.PuRd,
        labels={'n_folio':'Capacidad (%)'},
        ).update_layout(title= 'Capacidad de seguimiento de casos',
                       yaxis_title='Casos seguidos diariamente (%)',
                       xaxis_title='Fecha',
                       template='simple_white',
                 #      xaxis=dict(tickmode = 'array',
                  #                tickvals = list(range(12,88,3)),
                   #               ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                    #             ),
                 #   ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                  #             ).add_hline(y=10, 
                   #                        line_width=3, 
                    #                       line_dash='longdash', 
                     #                      line_color='olive',
                      #                     annotation_text='Meta nacional (10%)',
                       #                    annotation_position='bottom right'
                        #         ).add_hline(y=mean_bac_ind, 
                         #                    line_width=3, 
                          #                   line_dash='longdash', 
                           #                  line_color='green',
                            #                 annotation_text= 'Promedio BAC ('+str(mean_bac_ind)+'%)',
                             #                annotation_position='bottom right'
                              #       ).add_vrect(x0='51', x1='50', 
                               #            annotation_text='2020', 
                                #           annotation_position='top right',
                                 #          annotation=dict(font_size=18, 
                                  #                         font_family="'Open Sans', verdana, arial, sans-serif"),
                                   #                        opacity=0, 
                                    #                       line_width=0
                                     #     ).add_vrect(x0='84', x1='86', 
                                      #     annotation_text='2021', 
                                       #    annotation_position='top right',
                                        #   annotation=dict(font_size=18, 
                                         #                  font_family="'Open Sans', verdana, arial, sans-serif"),
                                          #                 opacity=0, 
                                           #                line_width=0
                                                     ).update_traces(mode='lines+markers', 
                                                                     line_color='grey',
                                                                     marker_line_width=1, 
                                                                     marker_size=10)

In [410]:
mean_ind8_perc100 = df_ind8_perc100.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean()['n_folio'].mean()

In [411]:
mean_ind8_perc80 = df_ind8_perc80.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean()['n_folio'].mean()

In [412]:
mean_ind8_perc60 = df_ind8_perc60.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean()['n_folio'].mean()

In [440]:
px.scatter(df_ind8_perc100.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean().reset_index(),
        x= 'semana_epidemiologica_21',
        y= 'n_folio',
        #trendline='rolling',
        #trendline_options=dict(window=5),
        color='n_folio',
        color_continuous_scale=px.colors.sequential.PuRd,
        labels={'n_folio':'Capacidad (%)'},
        ).update_layout(title= 'Ind8: Capacidad de seguimiento de casos',
                       yaxis_title='Capacidad de seguimiento diario de casos (%)',
                       xaxis_title='Semana epidemiológica',
                       yaxis_range= [0,105],
                       template='simple_white',
                       xaxis=dict(tickmode = 'array',
                                  tickvals = list(range(12,88,3)),
                                  ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                                 ),
                    ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                              ).add_hline(y=80,
                                            line_width=3, 
                                            line_dash='longdash', 
                                            line_color='#222A2A',
                                            annotation_text='Meta (90%)',
                                            annotation_position='bottom left'
                                 ).add_hline(y=mean_ind8_perc100, 
                                             line_width=3, 
                                             line_dash='longdash', 
                                             line_color='#750D86',
                                             annotation_text= 'Promedio ('+str(round(mean_ind8_perc100, 2))+'%)',
                                             annotation_position='bottom left'
                                     ).add_vrect(x0='51', x1='53', 
                                           annotation_text='2020', 
                                           annotation_position='bottom right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                          ).add_vrect(x0='84', x1='88', 
                                           annotation_text='2021', 
                                           annotation_position='bottom right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                                     ).update_traces(mode='lines+markers', 
                                                                     line_color='grey',
                                                                     marker_line_width=1, 
                                                                     marker_size=10)

In [428]:
px.scatter(df_ind8_perc80.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean().reset_index(),
        x= 'semana_epidemiologica_21',
        y= 'n_folio',
        #trendline='rolling',
        #trendline_options=dict(window=5),
        color='n_folio',
        color_continuous_scale=px.colors.sequential.PuRd,
        labels={'n_folio':'Capacidad (%)'},
        ).update_layout(title= 'Ind8: Capacidad de seguimiento de casos',
                       yaxis_title='Capacidad (%)',
                       xaxis_title='Semana epidemiológica',
                       yaxis_range= [0,105],
                       template='simple_white',
                       xaxis=dict(tickmode = 'array',
                                  tickvals = list(range(12,88,3)),
                                  ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                                 ),
                    ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                              ).add_hline(y=80,
                                            line_width=3, 
                                            line_dash='longdash', 
                                            line_color='#222A2A',
                                            annotation_text='Meta (90%)',
                                            annotation_position='bottom left'
                                 ).add_hline(y=mean_ind8_perc80, 
                                             line_width=3, 
                                             line_dash='longdash', 
                                             line_color='#750D86',
                                             annotation_text= 'Promedio ('+str(round(mean_ind8_perc80, 2))+'%)',
                                             annotation_position='bottom left'
                                     ).add_vrect(x0='51', x1='53', 
                                           annotation_text='2020', 
                                           annotation_position='bottom right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                          ).add_vrect(x0='84', x1='88', 
                                           annotation_text='2021', 
                                           annotation_position='bottom right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                                     ).update_traces(mode='lines+markers', 
                                                                     line_color='grey',
                                                                     marker_line_width=1, 
                                                                     marker_size=10)

In [427]:
px.scatter(df_ind8_perc60.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean().reset_index(),
        x= 'semana_epidemiologica_21',
        y= 'n_folio',
        #trendline='rolling',
        #trendline_options=dict(window=5),
        color='n_folio',
        color_continuous_scale=px.colors.sequential.PuRd,
        labels={'n_folio':'Capacidad (%)'},
        ).update_layout(title= 'Ind8: Capacidad de seguimiento de casos',
                       yaxis_title='Capacidad (%)',
                       xaxis_title='Semana epidemiológica',
                       yaxis_range= [0,105],
                       template='simple_white',
                       xaxis=dict(tickmode = 'array',
                                  tickvals = list(range(12,88,3)),
                                  ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                                 ),
                    ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                              ).add_hline(y=80,
                                            line_width=3, 
                                            line_dash='longdash', 
                                            line_color='#222A2A',
                                            annotation_text='Meta (90%)',
                                            annotation_position='top left'
                                 ).add_hline(y=mean_ind8_perc60, 
                                             line_width=3, 
                                             line_dash='longdash', 
                                             line_color='#750D86',
                                             annotation_text= 'Promedio ('+str(round(mean_ind8_perc60, 2))+'%)',
                                             annotation_position='bottom left'
                                     ).add_vrect(x0='51', x1='53', 
                                           annotation_text='2020', 
                                           annotation_position='bottom right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                          ).add_vrect(x0='84', x1='88', 
                                           annotation_text='2021', 
                                           annotation_position='bottom right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                                     ).update_traces(mode='lines+markers', 
                                                                     line_color='grey',
                                                                     marker_line_width=1, 
                                                                     marker_size=10)

# Indicador 10: Contactos con al menos 2 seguimientos dentro de su periodo de cuarentena de 14 días

## Objetivo: Evaluar la capacidad de seguimiento de contactos estrechos

### Meta: >90%

**Periodicidad:** Semanal

**Escala territorial:** Comuna, Regional, Nacional

**Fuente de información:** Base de seguimiento

### Cálculo del indicador a nivel comunal

$\frac{No.\:contactos\:que\:cumplieron\:cuarentena\:con\:al\:menos\:2\:seguimientos\:por\:comuna\:último\:establecimiento\:semana\:x}{No.\:contactos\:que\:cumplieron\:cuarentena\:por\:comuna\:ultimo\:establecimiento\:semana\:x}x100$

### Cálculo del indicador a nivel regional

$\frac{No.\:contactos\:que\:cumplieron\:cuarentena\:con\:al\:menos\:2\:seguimientos\:por\:región\:último\:establecimiento\:semana\:x}{No.\:contactos\:que\:cumplieron\:cuarentena\:por\:región\:ultimo\:establecimiento\:semana\:x}x100$

**Observación**

- El indicador se construye sobre los contactos que egresan (fecha de término de cuarentena) de seguimiento, durante la semana de interés (esto es, sólo registros egresados de la bandeja de seguimiento)
- El periodo de seguimiento para el contacto corresponde a la cantidad de días entre la 1era fecha en que el contacto está disponible en la bandeja de seguimiento hasta la última fecha fin cuarentena
- Se cumple con el indicador si en el período de seguimiento del contacto se registran al menos 2 actividades de seguimiento (las cuales pueden ser exitosas o no)
- Se excluyen los contactos que se transforman en caso y que están notificados (tiene folio asociado como caso)

In [200]:
df_seguimiento_ind10 = df_seguimiento_clean

In [201]:
# Se consideran sólo registros de casos activos o egresados
df_seguimiento_ind10_clean = df_seguimiento_ind10[(df_seguimiento_ind10['suspendido']=='egresado')]

In [202]:
# No se convierte en caso 

df_seguimiento_ind10_clean = df_seguimiento_ind10_clean[df_seguimiento_ind10_clean['folio_se_convierte_en_caso']!='t']

In [203]:
df_seguimiento_ind10_clean

Unnamed: 0,n_folio,nfolio_caso,nfolio_caso_indice,nfolio_pntm,nfolio_contacto_estrecho,tipo_seguimiento,dia_contacto,fecha_notificacion,nombre_institucion_indice,region_institucion_indice,...,comuna_seremi_xi,provincia_seremi_xi,edad,sexo,pop_hombres,pop_mujeres,pop_total,is_contact,is_index,is_index_or_contact
0,8753781,8753781.0,,,,caso,2021-03-02 00:00:00,2021-03-01,Hospital Regional (Coihaique),11,...,Coyhaique,Coyhaique,47.0,hombre,28763.0,29055.0,57818.0,False,False,False
1,SC9677760-11425750,,11425750,,9677760,contacto,2021-03-25 00:00:00,2021-03-20,Hospital Regional (Coihaique),11,...,Coyhaique,Coyhaique,19.0,mujer,28763.0,29055.0,57818.0,True,False,True
2,SC9780675-11714657,,11714657,,9780675,contacto,2021-03-29 00:00:00,2021-03-23,Actividades gestionadas por la Dirección del S...,11,...,Coyhaique,Coyhaique,31.0,mujer,28763.0,29055.0,57818.0,True,False,True
3,SC10084431-11964234,,11964234,,10084431,contacto,2021-03-29 00:00:00,2021-03-29,Actividades gestionadas por la Dirección del S...,11,...,Coyhaique,Coyhaique,15.0,mujer,28763.0,29055.0,57818.0,True,False,True
4,SC10332193-12293320,,12293320,,10332193,contacto,2021-04-04 00:00:00,2021-04-03,Posta de Salud Rural Lago Verde,11,...,Lago Verde,Coyhaique,82.0,hombre,494.0,358.0,852.0,True,False,True
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
293816,SC16034389-20188901,,20188901,,16034389,contacto,2021-08-25 00:00:00,2021-08-15,Hospital Regional (Coihaique),11,...,Coyhaique,Coyhaique,5.0,mujer,28763.0,29055.0,57818.0,True,False,True
293817,PNTM-7016056768,,,7016056768,,no notificado índice,Sin Datos,NaT,Sin Datos,Sin Datos,...,,,,,,,,False,False,False
293818,PNTM-7015472903,,,7015472903,,no notificado índice,Sin Datos,NaT,Sin Datos,Sin Datos,...,,,,,,,,False,False,False
293819,PNTM-7015314831,,,7015314831,,no notificado índice,Sin Datos,NaT,Sin Datos,Sin Datos,...,,,,,,,,False,False,False


In [204]:
# Se incluyen solo los tipos de seguimiento contacto

df_seguimiento_ind10_clean = df_seguimiento_ind10_clean[df_seguimiento_ind10_clean['tipo_seguimiento']=='contacto']

In [205]:
# Se excluyen datos de laboratorio

df_seguimiento_ind10_clean = df_seguimiento_ind10_clean[df_seguimiento_ind10_clean['nfolio_pntm'].isnull()]

In [206]:
df_seguimiento_ind10_clean

Unnamed: 0,n_folio,nfolio_caso,nfolio_caso_indice,nfolio_pntm,nfolio_contacto_estrecho,tipo_seguimiento,dia_contacto,fecha_notificacion,nombre_institucion_indice,region_institucion_indice,...,comuna_seremi_xi,provincia_seremi_xi,edad,sexo,pop_hombres,pop_mujeres,pop_total,is_contact,is_index,is_index_or_contact
1,SC9677760-11425750,,11425750,,9677760,contacto,2021-03-25 00:00:00,2021-03-20,Hospital Regional (Coihaique),11,...,Coyhaique,Coyhaique,19.0,mujer,28763.0,29055.0,57818.0,True,False,True
2,SC9780675-11714657,,11714657,,9780675,contacto,2021-03-29 00:00:00,2021-03-23,Actividades gestionadas por la Dirección del S...,11,...,Coyhaique,Coyhaique,31.0,mujer,28763.0,29055.0,57818.0,True,False,True
3,SC10084431-11964234,,11964234,,10084431,contacto,2021-03-29 00:00:00,2021-03-29,Actividades gestionadas por la Dirección del S...,11,...,Coyhaique,Coyhaique,15.0,mujer,28763.0,29055.0,57818.0,True,False,True
4,SC10332193-12293320,,12293320,,10332193,contacto,2021-04-04 00:00:00,2021-04-03,Posta de Salud Rural Lago Verde,11,...,Lago Verde,Coyhaique,82.0,hombre,494.0,358.0,852.0,True,False,True
5,SC10382396-12436348,,12436348,,10382396,contacto,2021-04-05 00:00:00,2021-04-05,Hospital Dr. Leopoldo Ortega R. (Chile Chico),11,...,Chile Chico,General Carrera,53.0,mujer,2577.0,2288.0,4865.0,True,False,True
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
293805,SC15945647-20102931,,20102931,,15945647,contacto,2021-08-19 00:00:00,2021-08-12,Centro de Salud Familiar La Junta,11,...,Cisnes,Aysen,42.0,hombre,3922.0,2595.0,6517.0,True,False,True
293806,SC16034333-20190588,,20190588,,16034333,contacto,2021-08-24 00:00:00,2021-08-15,Hospital Regional (Coihaique),11,...,Coyhaique,Coyhaique,31.0,hombre,28763.0,29055.0,57818.0,True,False,True
293814,SC16108657-20213469,,20213469,,16108657,contacto,2021-08-17 00:00:00,2021-08-17,Consultorio Víctor Domingo Silva,11,...,Coyhaique,Coyhaique,42.0,mujer,28763.0,29055.0,57818.0,True,False,True
293815,SC16074522-20251778,,20251778,,16074522,contacto,2021-08-24 00:00:00,2021-08-16,Hospital Regional (Coihaique),11,...,Coyhaique,Coyhaique,6.0,mujer,28763.0,29055.0,57818.0,True,False,True


In [213]:
# Calcula veces que un contacto fue contactado para seguimiento

ind10_contactado= df_seguimiento_ind10_clean.sort_values(by=['n_folio', 'dia_contacto']).groupby('n_folio').count()[['nfolio_contacto_estrecho']].rename(columns={'nfolio_contacto_estrecho':'veces_contactado'})

ind10_contactado.sample(1)

Unnamed: 0_level_0,veces_contactado
n_folio,Unnamed: 1_level_1
SC12214719-15063926,4


In [215]:
df_ind10_contactado = df_seguimiento_ind10_clean.merge(
                            ind10_contactado,
                            how='left',
                            left_on='n_folio',
                            right_on=ind10_contactado.index

                        )

In [216]:
df_ind10_contactado.sample(1)

Unnamed: 0,n_folio,nfolio_caso,nfolio_caso_indice,nfolio_pntm,nfolio_contacto_estrecho,tipo_seguimiento,dia_contacto,fecha_notificacion,nombre_institucion_indice,region_institucion_indice,...,provincia_seremi_xi,edad,sexo,pop_hombres,pop_mujeres,pop_total,is_contact,is_index,is_index_or_contact,veces_contactado
41966,SC13964168-17578808,,17578808,,13964168,contacto,2021-06-19 00:00:00,2021-06-18,Actividades gestionadas por la Dirección del S...,11,...,Coyhaique,46.0,hombre,28763.0,29055.0,57818.0,True,False,True,6


In [271]:
# Crea variable ind10_dos y ind10_tres representando metas de más de dos y tres contactos respectivamente

df_ind10_contactado['ind10_dos'] = df_ind10_contactado['veces_contactado']>=2
df_ind10_contactado['ind10_tres'] = df_ind10_contactado['veces_contactado']>=3

In [551]:
# Crea gráfico de etapa_clinica regional por semana epidemiologica

px.bar(df_ind10_contactado.groupby(['fecha_cumple_requisitos','ind10_dos']).count()[['n_folio']].reset_index(),
        x= 'fecha_cumple_requisitos',
        y= 'n_folio',
        color= 'ind10_dos',
               color_discrete_map={
                     True: '#3366CC',
                     False: '#FF6692'
                     },
        labels={'ind10_dos':'Cumplido'}, 
       ).update_layout(title= 'Capacidad de seguimiento de contactos estrechos (2 o más seguimientos)',
                    yaxis_title='Número de casos',
                    xaxis_title='Fecha',
                    template='simple_white',
                      ).update_traces(marker_line_color='rgb(0,0,0)',
                                      marker_line_width=0.1, 
                                      #opacity=0.8
                                     )                 
                    #xaxis=dict(tickmode = 'array',
                     #             tickvals = list(range(12,88,3)),
                      #            ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                      #           ),
               #     ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                #               ).add_vrect(x0='50', x1='50', 
                 #                          annotation_text='2020', 
                  #                         annotation_position='top right',
                   #                        annotation=dict(font_size=18, 
                    #                                       font_family="'Open Sans', verdana, arial, sans-serif"),
                     #                                      opacity=0, 
                      #                                     line_width=0
                       #                   ).add_vrect(x0='84', x1='86', 
                        #                   annotation_text='2021', 
                         #                  annotation_position='top right',
                          #                 annotation=dict(font_size=18, 
                           #                                font_family="'Open Sans', verdana, arial, sans-serif"),
                            #                               opacity=0, 
                             #                              line_width=0)  
                      

In [552]:
# Crea gráfico de etapa_clinica regional por semana epidemiologica

px.bar(df_ind10_contactado.groupby(['fecha_cumple_requisitos','ind10_tres']).count()[['n_folio']].reset_index(),
        x= 'fecha_cumple_requisitos',
        y= 'n_folio',
        color= 'ind10_tres',
        color_discrete_map={
                     True: '#3366CC',
                     False: '#FF6692'
                     },
        labels={'ind10_tres':'Contactado >=3'}, 
       ).update_layout(title= 'Capacidad de seguimiento de contactos estrechos (3 o más seguimientos)',
                    yaxis_title='Número de casos',
                    xaxis_title='Fecha',
                    template='simple_white', 
                      ).update_traces(marker_line_color='rgb(0,0,0)',
                                      marker_line_width=0.1, 
                                      #opacity=0.8
                                     )                  
                    #xaxis=dict(tickmode = 'array',
                     #             tickvals = list(range(12,88,3)),
                      #            ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                      #           ),
               #     ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                #               ).add_vrect(x0='50', x1='50', 
                 #                          annotation_text='2020', 
                  #                         annotation_position='top right',
                   #                        annotation=dict(font_size=18, 
                    #                                       font_family="'Open Sans', verdana, arial, sans-serif"),
                     #                                      opacity=0, 
                      #                                     line_width=0
                       #                   ).add_vrect(x0='84', x1='86', 
                        #                   annotation_text='2021', 
                         #                  annotation_position='top right',
                          #                 annotation=dict(font_size=18, 
                           #                                font_family="'Open Sans', verdana, arial, sans-serif"),
                            #                               opacity=0, 
                             #                              line_width=0)  
                      

In [274]:
df_ind10_tres= df_ind10_contactado.groupby(['fecha_cumple_requisitos', 'ind10_tres']).count()[['n_folio']].reset_index()

In [275]:
df_ind10_tres.tail(3)

Unnamed: 0,fecha_cumple_requisitos,ind10_tres,n_folio
344,2021-08-25,True,47
345,2021-08-27,False,4
346,2021-08-28,True,3


In [276]:
df_ind10_dos= df_ind10_contactado.groupby(['fecha_cumple_requisitos', 'ind10_dos']).count()[['n_folio']].reset_index()

In [277]:
df_ind10_dos.tail(3)

Unnamed: 0,fecha_cumple_requisitos,ind10_dos,n_folio
335,2021-08-25,True,49
336,2021-08-27,True,4
337,2021-08-28,True,3


In [278]:
df_ind10_perc = (df_ind10_tres[df_ind10_tres['ind10_tres']==True].set_index('fecha_cumple_requisitos')[['n_folio']]/df_ind10_tres.groupby('fecha_cumple_requisitos').sum('n_folio')[['n_folio']])*100

In [279]:
df_ind10_perc['ind10_dos_perc'] = (df_ind10_dos[df_ind10_dos['ind10_dos']==True].set_index('fecha_cumple_requisitos')[['n_folio']]/df_ind10_dos.groupby('fecha_cumple_requisitos').sum('n_folio')[['n_folio']])*100

In [282]:
df_ind10_perc= df_ind10_perc.rename(columns={'n_folio':'ind10_tres_perc'})


In [448]:
px.scatter(df_ind10_perc.reset_index(),
        x= 'fecha_cumple_requisitos',
        y= 'ind10_dos_perc',
        color='ind10_dos_perc',
        color_continuous_scale=px.colors.sequential.Plotly3_r,
        labels={'ind10_dos_perc':'Oportunidad (%)'},
        ).update_layout(title= 'Capacidad de seguimiento de contactos estrechos (2 o más seguimientos)',
                       yaxis_title='Oportunidad (%)',
                       xaxis_title='Fecha',
                       template='simple_white',
                 #      xaxis=dict(tickmode = 'array',
                  #                tickvals = list(range(12,88,3)),
                   #               ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                    #             ),
                 #   ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                  #             ).add_hline(y=10, 
                   #                        line_width=3, 
                    #                       line_dash='longdash', 
                     #                      line_color='olive',
                      #                     annotation_text='Meta nacional (10%)',
                       #                    annotation_position='bottom right'
                        #         ).add_hline(y=mean_bac_ind, 
                         #                    line_width=3, 
                          #                   line_dash='longdash', 
                           #                  line_color='green',
                            #                 annotation_text= 'Promedio BAC ('+str(mean_bac_ind)+'%)',
                             #                annotation_position='bottom right'
                              #       ).add_vrect(x0='51', x1='50', 
                               #            annotation_text='2020', 
                                #           annotation_position='top right',
                                 #          annotation=dict(font_size=18, 
                                  #                         font_family="'Open Sans', verdana, arial, sans-serif"),
                                   #                        opacity=0, 
                                    #                       line_width=0
                                     #     ).add_vrect(x0='84', x1='86', 
                                      #     annotation_text='2021', 
                                       #    annotation_position='top right',
                                        #   annotation=dict(font_size=18, 
                                         #                  font_family="'Open Sans', verdana, arial, sans-serif"),
                                          #                 opacity=0, 
                                           #                line_width=0
                                                     ).update_traces(mode='lines+markers', 
                                                                     line_color='grey',
                                                                     marker_line_width=1, 
                                                                     marker_size=10)

In [449]:
px.scatter(df_ind10_perc.reset_index(),
        x= 'fecha_cumple_requisitos',
        y= 'ind10_tres_perc',
        color='ind10_tres_perc',
        color_continuous_scale=px.colors.sequential.Plotly3_r,
        labels={'ind10_tres_perc':'Oportunidad (%)'},
        ).update_layout(title= 'Capacidad de seguimiento de contactos estrechos (3 o más seguimientos)',
                       yaxis_title='Oportunidad (%)',
                       xaxis_title='Fecha',
                       template='simple_white',
                 #      xaxis=dict(tickmode = 'array',
                  #                tickvals = list(range(12,88,3)),
                   #               ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                    #             ),
                 #   ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                  #             ).add_hline(y=10, 
                   #                        line_width=3, 
                    #                       line_dash='longdash', 
                     #                      line_color='olive',
                      #                     annotation_text='Meta nacional (10%)',
                       #                    annotation_position='bottom right'
                        #         ).add_hline(y=mean_bac_ind, 
                         #                    line_width=3, 
                          #                   line_dash='longdash', 
                           #                  line_color='green',
                            #                 annotation_text= 'Promedio BAC ('+str(mean_bac_ind)+'%)',
                             #                annotation_position='bottom right'
                              #       ).add_vrect(x0='51', x1='50', 
                               #            annotation_text='2020', 
                                #           annotation_position='top right',
                                 #          annotation=dict(font_size=18, 
                                  #                         font_family="'Open Sans', verdana, arial, sans-serif"),
                                   #                        opacity=0, 
                                    #                       line_width=0
                                     #     ).add_vrect(x0='84', x1='86', 
                                      #     annotation_text='2021', 
                                       #    annotation_position='top right',
                                        #   annotation=dict(font_size=18, 
                                         #                  font_family="'Open Sans', verdana, arial, sans-serif"),
                                          #                 opacity=0, 
                                           #                line_width=0
                                                     ).update_traces(mode='lines+markers', 
                                                                     line_color='grey',
                                                                     marker_line_width=1, 
                                                                     marker_size=10)

In [450]:
px.scatter(df_ind10_perc.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean().reset_index(),
        x= 'semana_epidemiologica_21',
        y= 'ind10_tres_perc',
        #trendline='rolling',
        #trendline_options=dict(window=5),
        color='ind10_tres_perc',
        color_continuous_scale=px.colors.sequential.Plotly3_r,
        labels={'ind10_tres_perc':'Oportunidad (%)'},
        ).update_layout(title= 'Capacidad de seguimiento de contactos estrechos (3 o más seguimientos)',
                       yaxis_title='Oportunidad (%)',
                       xaxis_title='Semana epidemiológica',
                       #yaxis_range= [0,105],
                       template='simple_white',
                       xaxis=dict(tickmode = 'array',
                                  tickvals = list(range(12,88,3)),
                                  ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                                 ),
                    ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                              ).add_hline(y=90,
                                            line_width=3, 
                                            line_dash='longdash', 
                                            line_color='#222A2A',
                                            annotation_text='Meta (90%)',
                                            annotation_position='bottom left'
                                # ).add_hline(y=mean_ind7, 
                                 #            line_width=3, 
                                  #           line_dash='longdash', 
                                   #          line_color='#750D86',
                                    #         annotation_text= 'Promedio ('+str(round(mean_ind7, 2))+'%)',
                                     #        annotation_position='bottom left'
                                     ).add_vrect(x0='51', x1='53', 
                                           annotation_text='2020', 
                                           annotation_position='bottom right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                          ).add_vrect(x0='84', x1='88', 
                                           annotation_text='2021', 
                                           annotation_position='bottom right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                                     ).update_traces(mode='lines+markers', 
                                                                     line_color='grey',
                                                                     marker_line_width=1, 
                                                                     marker_size=10)

In [452]:
px.scatter(df_ind10_perc.reset_index().merge(data_aysen_clean_21[['fecha_notificacion','semana_epidemiologica_21']], 
                   left_on='fecha_cumple_requisitos',
                   right_on='fecha_notificacion',
                   how='left').groupby('semana_epidemiologica_21').mean().reset_index(),
        x= 'semana_epidemiologica_21',
        y= 'ind10_dos_perc',
        #trendline='rolling',
        #trendline_options=dict(window=5),
        color='ind10_dos_perc',
        color_continuous_scale=px.colors.sequential.Plotly3_r,
        labels={'ind10_dos_perc':'Oportunidad (%)'},
        ).update_layout(title= 'Ind10: Capacidad de seguimiento de contactos estrechos (2 o más seguimientos)',
                       yaxis_title='Oportunidad (%)',
                       xaxis_title='Semana epidemiológica',
                      # yaxis_range= [0,105],
                       template='simple_white',
                       xaxis=dict(tickmode = 'array',
                                  tickvals = list(range(12,88,3)),
                                  ticktext = list(list(range(12,54,3))+list(range(1,88,3))),
                                 ),
                    ).add_vline(x=53.5, line_width=3, line_dash='dash', line_color='gray'
                              ).add_hline(y=90,
                                            line_width=3, 
                                            line_dash='longdash', 
                                            line_color='#222A2A',
                                            annotation_text='Meta (90%)',
                                            annotation_position='bottom left'
                                # ).add_hline(y=mean_ind7, 
                                 #            line_width=3, 
                                  #           line_dash='longdash', 
                                   #          line_color='#750D86',
                                    #         annotation_text= 'Promedio ('+str(round(mean_ind7, 2))+'%)',
                                     #        annotation_position='bottom left'
                                     ).add_vrect(x0='51', x1='53', 
                                           annotation_text='2020', 
                                           annotation_position='bottom right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                          ).add_vrect(x0='84', x1='88', 
                                           annotation_text='2021', 
                                           annotation_position='bottom right',
                                           annotation=dict(font_size=18, 
                                                           font_family="'Open Sans', verdana, arial, sans-serif"),
                                                           opacity=0, 
                                                           line_width=0
                                                     ).update_traces(mode='lines+markers', 
                                                                     line_color='grey',
                                                                     marker_line_width=1, 
                                                                     marker_size=10)