# Informe Variantes SARS-CoV-2

## Antecedentes

El virus SARS-CoV-2 pertenece a la familia de los betacoronavirus, los cuales a diferencia de otros virus ARN, tienen la capacidad de corregir errores durante el proceso de replicación, y tienen menores tasas de mutaciones comparado con otros virus Infuenza o VIH. A medida que el SAR-CoV-2 se ha extendido en el mundo, ha acumulado mutaciones en el genoma viral. Los investigadores han examinado estas mutaciones para estudiar la caracterización del virus y comprender la epidemiología y sus patrones de transmisión. Desde la identificación inicial del SARS-CoV-2, hasta el 8 de mayo de 2021, se han compartido, a nivel mundial, más de 1.400.000 secuencias genómicas completas a través de bases de datos de acceso público (GISAID).  
Debido a que la OMS ha modificado la nominación de las variantes, se presenta un resumen con las variantes de interés, de preocupación y de alta consecuencia.


In [40]:
# Importa librerias a utilizar

import pandas as pd
import numpy as np
import plotly.express as px
import locale

In [175]:
# Pretende ser un navegador web para bypasear las restricciones de seguridad de la OMS

import requests

url = 'https://www.who.int/es/activities/tracking-SARS-CoV-2-variants'

header = {
  "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.75 Safari/537.36",
  "X-Requested-With": "XMLHttpRequest"
}

r = requests.get(url, headers=header)

# Importa datos desde la OMS

web_data = pd.read_html(r.text)

## Variante de interés

Variante con marcadores genéticos específicos que se han asociado con cambios en la unión al receptor, neutralización reducida por anticuerpos generados contra infecciones o vacunas previas, eficacia reducida de tratamientos, impacto diagnóstico potencial o aumento previsto de la transmisibilidad o gravedad de la enfermedad.
Posibles atributos de una variante de interés:

-	Marcadores genéticos específicos que se predice que afectarán la transmisión, el diagnóstico, la terapéutica o el escape inmunológico.
-	Evidencia de que es la causa de una mayor proporción de casos o grupos de brotes únicos.
-	Prevalencia o expansión limitada en los EE. UU. o en otros países.

Una variante de interés puede requerir una o más acciones de salud pública apropiadas, incluida una vigilancia de secuencia mejorada, una caracterización mejorada de laboratorio o investigaciones epidemiológicas para evaluar la facilidad con la que el virus se propaga a otros, la gravedad de la enfermedad, la eficacia de la terapéutica y si las vacunas actualmente autorizadas ofrecen protección.


**Consideradas actualmente como variantes de interes**

In [185]:
web_data[1]

Unnamed: 0,Etiqueta OMS,Linaje Pango,Clado/linaje GISAID,Clado Nextstrain,Primeras muestras documentadas,Fecha de designación
0,Eta,B.1.525,G/484K.V3,21D,"Múltiples países, diciembre 2020",17 marzo 2021
1,Iota,B.1.526,GH/253G.V1,21F,"Estados Unidos de América, noviembre 2020",24 marzo 2021
2,Kappa,B.1.617.1,G/452R.V3,21B,"India, octubre 2020",4 abril 2021
3,Lambda,C.37,GR/452Q.V1,21G,"Perú, diciembre 2020",14 junio 2021


\* **PANGO:** *Phylogenetic Assignment of Named Global Outbreak* [más información](https://cov-lineages.org/lineage_list.html)

\** **GISAID:** *Global Initiative on Sharing All Influenza Data* [más información](https://www.gisaid.org/hcov19-variants/)

\*\*\* **NEXTSTRAIN:** *Scientific and public health potential of pathogen genome data* [más información](https://nextstrain.org/ncov/gisaid/global)

## Variante de preocupación

Una variante para la cual hay evidencia de un aumento en la transmisibilidad, enfermedad más grave (por ejemplo, aumento de hospitalizaciones o muertes), reducción significativa de la neutralización por anticuerpos generados durante una infección o vacunación previa, eficacia reducida de tratamientos o vacunas o fallas en la detección del diagnóstico.
Posibles atributos de una variante de interés:

-	Evidencia de impacto en diagnósticos, tratamientos o vacunas.
-	Interferencia generalizada con los objetivos de las pruebas de diagnóstico.
-	Evidencia de susceptibilidad sustancialmente disminuida a una o más clases de terapias.
-	Evidencia de una disminución significativa de la neutralización por anticuerpos generados durante una infección o vacunación previa.
-	Evidencia de protección reducida inducida por vacunas contra enfermedades graves.
-	Evidencia de una mayor transmisibilidad.
-	Evidencia de una mayor gravedad de la enfermedad.

Las variantes de preocupación pueden requerir una o más acciones de salud pública apropiadas, como la notificación a la OMS en virtud del Reglamento Sanitario Internacional, la notificación a los CDC, los esfuerzos locales o regionales para controlar la propagación, el aumento de las pruebas o la investigación para determinar la eficacia de las vacunas y los tratamientos contra la variante. Según las características de la variante, las consideraciones adicionales pueden incluir el desarrollo de nuevos diagnósticos o la modificación de vacunas o tratamientos.


**Consideradas actualmente como variantes de preocupación**

In [182]:
web_data[0]

Unnamed: 0,Etiqueta OMS,Linaje Pango,Clado/linaje GISAID,Clado Nextstrain,Cambios aminoacidicos adicionales monitoreados,Primeras muestras documentadassamples,Fecha de designación
0,Alpha,B.1.1.7,GRY,20I (V1),+S:484K+S:452R,"Reino Unido, septiembre 2020",18 diciembre 2020
1,Beta,B.1.351 B.1.351.2B.1.351.3,GH/501Y.V2,20H (V2),+S:L18F,"Sudáfrica, mayo 2020",18 diciembre 2020
2,Gamma,P.1 P.1.1P.1.2P.1.4P.1.6P.1.7,GR/501Y.V3,20J (V3),+S:681H,"Brasil, noviembre 2020",11 enero 2021
3,Delta,B.1.617.2AY.1AY.2AY.3AY.3.1,G/478K.V1,21A,+S:417N,"India, octubre 2020",VOI: 4 abril 2021 VOC: 11 mayo 2021


\* **PANGO:** *Phylogenetic Assignment of Named Global Outbreak* [más información](https://cov-lineages.org/lineage_list.html)

\** **GISAID:** *Global Initiative on Sharing All Influenza Data* [más información](https://www.gisaid.org/hcov19-variants/)

\*\*\* **NEXTSTRAIN:** *Scientific and public health potential of pathogen genome data* [más información](https://nextstrain.org/ncov/gisaid/global)

## Variante de alta consecuencia

Una variante de alta consecuencia, tiene una clara evidencia de que las medidas de prevención o las contramedidas médicas (MCM) han reducido significativamente la efectividad en relación con las variantes que circulaban anteriormente.

Posibles atributos de una variante de alta consecuencia:

-	Impacto en las contramedidas médicas (MCM)
-	Fallo de diagnóstico demostrado.
-	Evidencia que sugiere una reducción significativa en la efectividad de la vacuna, un número desproporcionadamente alto de casos de avance de la vacuna o una protección muy baja inducida por la vacuna contra la enfermedad grave.
-	Susceptibilidad significativamente reducida a múltiples autorizaciones de uso de emergencia (EUA) o terapias aprobadas.
-	Enfermedad clínica más grave y aumento de las hospitalizaciones.

Una variante de gran consecuencia requeriría una notificación a la OMS de conformidad con el Reglamento Sanitario Internacional, un informe a los CDC, un anuncio de estrategias para prevenir o contener la transmisión y recomendaciones para actualizar los tratamientos y las vacunas.


## Reclacificación de Variantes de interes y Variantes de preocupación

Se podrá reclasificar una variante del SARS-CoV-2 que se haya considerado anteriormente como preocupante o de interés si se demuestra de forma concluyente que ya no entraña riesgos importantes añadidos a la salud pública mundial con respecto a otras variantes del virus. 

Con ese fin, los expertos llevarán a cabo una evaluación crítica teniendo en cuenta varios criterios y en colaboración con el Grupo Consultivo Técnico de la OMS sobre Evolución de los Virus. Esos criterios pueden ser: la incidencia observada o la prevalencia relativa de las variantes detectadas en las muestras secuenciadas a lo largo del tiempo y en distintas ubicaciones geográficas, la presencia o ausencia de otros factores de riesgo y cualquier efecto que esté causando en las medidas de control.


## Variantes actualmente designadas como Alertas de vigilancia reforzada

Cualquier variante del SARS-CoV-2 que presente modificaciones en el genoma que, según se sospeche, puedan afectar a las características del virus y parezcan indicar que la variante puede entrañar riesgos en el futuro, a pesar de que no se disponga de pruebas claras de los cambios que pueda causar en el fenotipo o en las características epidemiológicas del virus y sea necesario mantener el seguimiento y continuar estudiándola hasta que no se disponga de más información. 

Nota: dado que los conocimientos sobre el impacto de estas variantes pueden variar rápidamente, es posible que, en el futuro, se emitan nuevas alertas de vigilancia reforzada y se retiren otras; esta es la razón por la cual la OMS no asigna, por el momento, denominaciones a estas variantes. También es posible que se mantenga la vigilancia de variantes clasificadas anteriormente como preocupantes o de interés durante un periodo más prolongado, manteniéndolas en la categoría de alertas de vigilancia reforzada y conservando la denominación asignada por la OMS hasta nuevo aviso.

**Consideradas actualmente como Alertas de vigilancia reforzada**

In [183]:
web_data[2]

Unnamed: 0,Linajes establecidos mediante la nomenclatura Pango,Clado/linaje GISAID,Clados de Nextstrain,Muestras más antiguas documentadas,Fecha en que se asignó la denominación
0,B.1.427B.1.429*,GH/452R.V1,21C,"Estados Unidos de América, marzo de 2020",VOI: 5 de marzo de 2021 Alerta: 6 de julio de ...
1,R.1,GR,-,"Varios países, enero de 2021",07 de abril de 2021
2,B.1.466.2,GH,-,"Indonesia, noviembre de 2020",28 de abril de 2021
3,B.1.621B.1.621.1,GH,21H,"Colombia, enero de 2021",26 de mayo de 2021
4,B.1.1.318,GR,,"Varios países, enero de 2021",2 de junio de 2021
5,B.1.1.519,GR,20B/S.732A,,2 de junio de 2021
6,C.36.3C.36.3.1,GR,,"Varios países, enero de 2021",16 de junio de 2021
7,B.1.214.2,G,-,"Varios países, noviembre de 2020",30 de junio de 2021
8,B.1.1.523,GR,-,"Varios países, mayo de 2020",14 de julio de 2021
9,B.1.619,G,-,"Varios países, mayo de 2020",14 de julio de 2021


\* **PANGO:** *Phylogenetic Assignment of Named Global Outbreak* [más información](https://cov-lineages.org/lineage_list.html)

\** **GISAID:** *Global Initiative on Sharing All Influenza Data* [más información](https://www.gisaid.org/hcov19-variants/)

\*\*\* **NEXTSTRAIN:** *Scientific and public health potential of pathogen genome data* [más información](https://nextstrain.org/ncov/gisaid/global)

## Importa datos de variantes

In [64]:
import janitor

In [66]:
df_variantes = pd.read_excel('data/20210907_Región de Aysén del General Carlos Ibáñez del Campo_Base_Variantes_pm.xlsx',
                              sheet_name='Base'
                             ).clean_names()

In [68]:
df_variantes.columns

Index(['n_documento', 'tipo_documento', 'clasificacion_linaje',
       'variante_linaje', 'pango', 'tecnica', 'tipo_de_caso',
       'folio_epivigila', 'nombre_completo', 'nacionalidad', 'estado_paciente',
       'edad', 'sexo', 'pais_de_residencia', 'region_de_residencia',
       'comuna_de_residencia', 'via_residencia', 'direccion',
       'dpto_residencia', 'latitud', 'longitud', 'vuelo',
       'pais_procedencia_viajeros', 'nummue_isp', 'fecha_toma_de_muestra',
       'establecimiento_toma_de_muestra',
       'fecha_resultado_secuenciacion_genotipificacion', 'lugar_de_reposo',
       'presentacion_clinica', 'n_contactos_estrechos', 'hospitalizacion',
       'uci', 'fecha_ingreso_hospitalizacion', 'fecha_ingreso_uci',
       'dg_fallecido', 'fecha_defuncion', 'esquema_de_vacunacion_completo',
       'fecha_1_dosis', 'fecha_2_dosis', 'fecha_3_dosis', 'nombre_vacuna_1',
       'nombre_vacuna_2', 'nombre_vacuna_3', 'vacuna_previo_a_ftm', 'informe',
       'emisor_de_informe', 'embarazo

In [77]:
df_variantes[[
    'folio_epivigila',
    'fecha_resultado_secuenciacion_genotipificacion',
    'clasificacion_linaje',
    'variante_linaje',
    'pango',
    'presentacion_clinica',
    'tecnica',
    'tipo_de_caso',
    'estado_paciente',
    'edad',
    'sexo',
    'pais_de_residencia',
    'region_de_residencia',
    'comuna_de_residencia',
    'latitud',
    'longitud',
    'vuelo',
    'pais_procedencia_viajeros',
    'fecha_toma_de_muestra',
    'lugar_de_reposo',
    'presentacion_clinica',
    'n_contactos_estrechos', 
    'hospitalizacion',
    'uci', 
    'fecha_ingreso_hospitalizacion', 
    'fecha_ingreso_uci',
    'dg_fallecido', 
    'fecha_defuncion', 
    'esquema_de_vacunacion_completo',
    'fecha_1_dosis', 
    'fecha_2_dosis', 
    'fecha_3_dosis', 
    'nombre_vacuna_1',
    'nombre_vacuna_2', 
    'nombre_vacuna_3', 
    'vacuna_previo_a_ftm', 
    'informe',
    'emisor_de_informe', 
    'embarazo', 
    'comorbilidad', 
    'fis', 
    'frs',
    'id_pntm', 
    'region_de_notificacion'
    
]]

Unnamed: 0,folio_epivigila,fecha_resultado_secuenciacion_genotipificacion,clasificacion_linaje,variante_linaje,pango,presentacion_clinica,tecnica,tipo_de_caso,estado_paciente,edad,...,nombre_vacuna_3,vacuna_previo_a_ftm,informe,emisor_de_informe,embarazo,comorbilidad,fis,frs,id_pntm,region_de_notificacion
0,16120644,2021-09-01,VOC,GAMMA,P.1,ASINTOMATICO,SECUENCIACION GENOMICA,COMUNITARIO,VIVO,10,...,,NO,VIG. COMUNITARIA ISP,INSTITUTO SALUD PUBLICA,,,2021-08-17,2021-09-02,,Región de Aysén del General Carlos Ibáñez del ...
1,16237260,2021-09-01,NO AMPLIFICA,NO AMPLIFICA,NO AMPLIFICA,SINTOMATICO,SECUENCIACION GENOMICA,COMUNITARIO,VIVO,23,...,,NO,VIG. COMUNITARIA ISP,INSTITUTO SALUD PUBLICA,False,,2021-08-19,2021-09-02,,Región de Aysén del General Carlos Ibáñez del ...
2,16120624,2021-09-01,VOC,GAMMA,P.1,ASINTOMATICO,SECUENCIACION GENOMICA,COMUNITARIO,VIVO,44,...,,SI,VIG. COMUNITARIA ISP,INSTITUTO SALUD PUBLICA,,,2021-08-17,2021-09-02,,Región de Aysén del General Carlos Ibáñez del ...
3,16275651,2021-09-01,VOC,GAMMA,P.1,ASINTOMATICO,SECUENCIACION GENOMICA,COMUNITARIO,VIVO,43,...,,SI,VIG. COMUNITARIA ISP,INSTITUTO SALUD PUBLICA,,,2021-08-23,2021-09-02,,Región de Aysén del General Carlos Ibáñez del ...
4,16241767,2021-09-01,VOC,GAMMA,P.1,SINTOMATICO,SECUENCIACION GENOMICA,COMUNITARIO,VIVO,42,...,,SI,VIG. COMUNITARIA ISP,INSTITUTO SALUD PUBLICA,False,,2021-08-18,2021-09-02,,Región de Aysén del General Carlos Ibáñez del ...
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
263,,2021-09-06,VOC,DELTA,SIN PANGO,,GENOTIPIFICACION,COMUNITARIO,,,...,,NO,2021-09-06 PCR MUTACIONES,RED LABORATORIOS PUNTOS DE ENTRADA,,,NaT,2021-09-07,7.017104e+09,
264,,2021-09-06,VOC,DELTA,SIN PANGO,,GENOTIPIFICACION,COMUNITARIO,,,...,,NO,2021-09-06 PCR MUTACIONES,RED LABORATORIOS PUNTOS DE ENTRADA,,,NaT,2021-09-07,7.017109e+09,
265,,2021-09-06,VOC,DELTA,SIN PANGO,,GENOTIPIFICACION,COMUNITARIO,,,...,,SI,2021-09-06 PCR MUTACIONES,RED LABORATORIOS PUNTOS DE ENTRADA,,,NaT,2021-09-07,7.017090e+09,
266,,2021-09-06,VOC,GAMMA,SIN PANGO,,GENOTIPIFICACION,COMUNITARIO,,,...,,SI,2021-09-06 PCR MUTACIONES,RED LABORATORIOS PUNTOS DE ENTRADA,,,NaT,2021-09-07,7.017135e+09,


In [96]:
df_variantes['region_de_notificacion'].value_counts()

Región de Aysén del General Carlos Ibáñez del Campo    234
Región Metropolitana de Santiago                         1
Name: region_de_notificacion, dtype: int64

In [97]:
df_variantes_clean= df_variantes[df_variantes['region_de_notificacion']=='Región de Aysén del General Carlos Ibáñez del Campo']

In [98]:
df_variantes_clean['variante_linaje'].value_counts()

GAMMA                                                                        130
LAMBDA                                                                        54
NO AMPLIFICA                                                                  33
B.1.1                                                                          5
INDETERMINADO                                                                  5
B.1.1.348                                                                      2
ALFA                                                                           1
B.1                                                                            1
NO SE DETECTAN MUTACIONES PARA VARIANTES DE INTERES POR PARTE DE ESTE KIT      1
N.4                                                                            1
B.1.427/429                                                                    1
Name: variante_linaje, dtype: int64

In [143]:
# Calcula número de secuenciaciones o genotipificaciones realizadas en fecha X

df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion']).count()[['n_documento']]

Unnamed: 0_level_0,n_documento
fecha_resultado_secuenciacion_genotipificacion,Unnamed: 1_level_1
2021-03-21,2
2021-04-05,2
2021-04-08,1
2021-04-19,4
2021-05-05,6
2021-05-14,10
2021-05-19,7
2021-05-24,1
2021-05-26,15
2021-06-09,11


In [141]:
# Transforma formato de DF de long a wide mediante pivot para mejor procesamiento multivariable

df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'variante_linaje']).count()[['n_documento']].reset_index().pivot(
    index='fecha_resultado_secuenciacion_genotipificacion',
    columns='variante_linaje', 
    values=['n_documento']
).fillna(0).cumsum()['n_documento'].clean_names().rename(
    columns={
        'alfa':'Alfa',
        'b_1':'B.1',
        'b_1_1':'B.1.1',
        'b_1_1_348':'B.1.1.348',
        'gamma':'Gamma',
        'indeterminado':'Indeterminado',
        'lambda':'Lambda',
        'n_4':'N.4',
        'no_amplifica':'No amplifica',
        'no_se_detectan_mutaciones_para_variantes_de_interes_por_parte_de_este_kit':'VOI no detectadas'
            })

variante_linaje,Alfa,B.1,B.1.1,B.1.1.348,Gamma,Indeterminado,Lambda,N.4,No amplifica,VOI no detectadas
fecha_resultado_secuenciacion_genotipificacion,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
2021-03-21,0.0,0.0,0.0,1.0,0.0,0.0,0.0,1.0,0.0,0.0
2021-04-05,0.0,0.0,1.0,2.0,0.0,0.0,0.0,1.0,0.0,0.0
2021-04-08,0.0,0.0,1.0,2.0,0.0,0.0,0.0,1.0,1.0,0.0
2021-04-19,0.0,0.0,2.0,2.0,0.0,0.0,3.0,1.0,1.0,0.0
2021-05-05,0.0,0.0,2.0,2.0,2.0,0.0,7.0,1.0,1.0,0.0
2021-05-14,0.0,0.0,2.0,2.0,6.0,0.0,13.0,1.0,1.0,0.0
2021-05-19,0.0,0.0,2.0,2.0,9.0,0.0,17.0,1.0,1.0,0.0
2021-05-24,0.0,0.0,2.0,2.0,9.0,0.0,17.0,1.0,2.0,0.0
2021-05-26,1.0,0.0,4.0,2.0,13.0,0.0,25.0,1.0,2.0,0.0
2021-06-09,1.0,1.0,5.0,2.0,20.0,0.0,27.0,1.0,2.0,0.0


In [126]:
px.line(df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'variante_linaje']).count()[['n_documento']].reset_index().pivot(
    index='fecha_resultado_secuenciacion_genotipificacion',
    columns='variante_linaje', 
    values=['n_documento']
).fillna(0).cumsum().clean_names().rename(
    columns={
        'alfa':'Alfa',
        'b_1':'B.1',
        'b_1_1':'B.1.1',
        'b_1_1_348':'B.1.1.348',
        'gamma':'Gamma',
        'indeterminado':'Indeterminado',
        'lambda':'Lambda',
        'n_4':'N.4',
        'no_amplifica':'No amplifica',
        'no_se_detectan_mutaciones_para_variantes_de_interes_por_parte_de_este_kit':'VOI no detectadas'
            })['n_documento'],
        labels={'variante_linaje':'Variante detectada'},
       ).update_layout(
    title= 'Variantes detectadas en la Región de Aysén',
    yaxis_title='No. de casos identificados por variante',
    xaxis_title='Fecha de resultado de Secuenciación o Genotipificación',
    template='simple_white',
    
    
)


In [128]:
px.line(df_variantes.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'variante_linaje']).count()[['n_documento']].reset_index().pivot(
    index='fecha_resultado_secuenciacion_genotipificacion',
    columns='variante_linaje', 
    values=['n_documento']
).fillna(0).cumsum().clean_names().rename(
    columns={
        'alfa':'Alfa',
        'b_1':'B.1',
        'b_1_1':'B.1.1',
        'b_1_1_348':'B.1.1.348',
        'delta':'Delta',
        'gamma':'Gamma',
        'indeterminado':'Indeterminado',
        'lambda':'Lambda',
        'mu':'Mu',
        'n_4':'N.4',
        'no_amplifica':'No amplifica',
        'no_se_detectan_mutaciones_para_variantes_de_interes_por_parte_de_este_kit':'VOI no detectadas'
            })['n_documento'],
        labels={'variante_linaje':'Variante detectada'},
       ).update_layout(
    title= 'Variantes detectadas en la Región de Aysén',
    yaxis_title='No. de casos identificados por variante',
    xaxis_title='Fecha de resultado de Secuenciación o Genotipificación',
    template='simple_white',
    
    
)


In [174]:
px.line(df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'variante_linaje']).count()[['n_documento']].reset_index().pivot(
    index='fecha_resultado_secuenciacion_genotipificacion',
    columns='variante_linaje', 
    values=['n_documento']
).fillna(0).cumsum().clean_names().rename(
    columns={
        'alfa':'Alfa',
        'b_1':'B.1',
        'b_1_1':'B.1.1',
        'b_1_1_348':'B.1.1.348',
        'gamma':'Gamma',
        'indeterminado':'Indeterminado',
        'lambda':'Lambda',
        'n_4':'N.4',
        'no_amplifica':'No amplifica',
        'no_se_detectan_mutaciones_para_variantes_de_interes_por_parte_de_este_kit':'VOI no detectadas'
            })['n_documento'].drop(['No amplifica','Indeterminado'], axis=1),
        labels={'variante_linaje':'Variante detectada'},
        
       ).update_layout(
    title= 'Variantes detectadas en la Región de Aysén',
    yaxis_title='No. de casos identificados por variante',
    xaxis_title='Fecha de resultado de Secuenciación o Genotipificación',
    template='simple_white',
    
    
).add_bar(
    x= df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion']).count()[['n_documento']].index,
    y= df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion']).count()[['n_documento']].n_documento,
    name='No. de secuenciaciones'


    )

In [129]:
px.area(df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'variante_linaje']).count()[['n_documento']].reset_index().pivot(
    index='fecha_resultado_secuenciacion_genotipificacion',
    columns='variante_linaje', 
    values=['n_documento']
).fillna(0).cumsum().clean_names().rename(
    columns={
        'alfa':'Alfa',
        'b_1':'B.1',
        'b_1_1':'B.1.1',
        'b_1_1_348':'B.1.1.348',
        'gamma':'Gamma',
        'indeterminado':'Indeterminado',
        'lambda':'Lambda',
        'n_4':'N.4',
        'no_amplifica':'No amplifica',
        'no_se_detectan_mutaciones_para_variantes_de_interes_por_parte_de_este_kit':'VOI no detectadas'
            })['n_documento'],
        labels={'variante_linaje':'Variante detectada'},
       ).update_layout(
    title= 'Variantes detectadas en la Región de Aysén',
    yaxis_title='No. de casos identificados por variante',
    xaxis_title='Fecha de resultado de Secuenciación o Genotipificación',
    template='simple_white',
    
    
)

In [140]:
px.area(df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'variante_linaje']).count()[['n_documento']].reset_index().pivot(
    index='fecha_resultado_secuenciacion_genotipificacion',
    columns='variante_linaje', 
    values=['n_documento']
).fillna(0).cumsum().clean_names().rename(
    columns={
        'alfa':'Alfa',
        'b_1':'B.1',
        'b_1_1':'B.1.1',
        'b_1_1_348':'B.1.1.348',
        'gamma':'Gamma',
        'indeterminado':'Indeterminado',
        'lambda':'Lambda',
        'n_4':'N.4',
        'no_amplifica':'No amplifica',
        'no_se_detectan_mutaciones_para_variantes_de_interes_por_parte_de_este_kit':'VOI no detectadas'
            })['n_documento'].drop(['No amplifica','Indeterminado'], axis=1),
        labels={'variante_linaje':'Variante detectada'},
       ).update_layout(
    title= 'Variantes detectadas en la Región de Aysén',
    yaxis_title='No. de casos identificados por variante',
    xaxis_title='Fecha de resultado de Secuenciación o Genotipificación',
    template='simple_white',
    
    
)

In [139]:
px.area(df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'variante_linaje']).count()[['n_documento']].reset_index().pivot(
    index='fecha_resultado_secuenciacion_genotipificacion',
    columns='variante_linaje', 
    values=['n_documento']
).fillna(0).cumsum().clean_names().rename(
    columns={
        'alfa':'Alfa',
        'b_1':'B.1',
        'b_1_1':'B.1.1',
        'b_1_1_348':'B.1.1.348',
        'gamma':'Gamma',
        'indeterminado':'Indeterminado',
        'lambda':'Lambda',
        'n_4':'N.4',
        'no_amplifica':'No amplifica',
        'no_se_detectan_mutaciones_para_variantes_de_interes_por_parte_de_este_kit':'VOI no detectadas'
            })['n_documento'],
        labels={'variante_linaje':'Variante detectada'},
        groupnorm='percent'
       ).update_layout(
    title= 'Variantes detectadas en la Región de Aysén',
    yaxis_title='% de casos identificados por variante',
    xaxis_title='Fecha de resultado de Secuenciación o Genotipificación',
    template='simple_white',
    
    
)

In [136]:
# Sin negativos

px.area(df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'variante_linaje']).count()[['n_documento']].reset_index().pivot(
    index='fecha_resultado_secuenciacion_genotipificacion',
    columns='variante_linaje', 
    values=['n_documento']
).fillna(0).cumsum().clean_names().rename(
    columns={
        'alfa':'Alfa',
        'b_1':'B.1',
        'b_1_1':'B.1.1',
        'b_1_1_348':'B.1.1.348',
        'gamma':'Gamma',
        'indeterminado':'Indeterminado',
        'lambda':'Lambda',
        'n_4':'N.4',
        'no_amplifica':'No amplifica',
        'no_se_detectan_mutaciones_para_variantes_de_interes_por_parte_de_este_kit':'VOI no detectadas'
            })['n_documento'].drop(['No amplifica','Indeterminado'], axis=1),
        labels={'variante_linaje':'Variante detectada'},
        groupnorm='percent'
       ).update_layout(
    title= 'Variantes detectadas en la Región de Aysén',
    yaxis_title='% de casos identificados por variante',
    xaxis_title='Fecha de resultado de Secuenciación o Genotipificación',
    template='simple_white',
    
    
)

### Variantes circulantes de SARS-CoV-2 en la Región de Aysén según sexo


In [189]:
df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'variante_linaje']).count()[['n_documento']].reset_index(
#).pivot(
  #  index='fecha_resultado_secuenciacion_genotipificacion',
   # columns='variante_linaje', 
    #values=['n_documento']
).fillna(0).cumsum().clean_names().rename(
    columns={
        'alfa':'Alfa',
        'b_1':'B.1',
        'b_1_1':'B.1.1',
        'b_1_1_348':'B.1.1.348',
        'gamma':'Gamma',
        'indeterminado':'Indeterminado',
        'lambda':'Lambda',
        'n_4':'N.4',
        'no_amplifica':'No amplifica',
        'no_se_detectan_mutaciones_para_variantes_de_interes_por_parte_de_este_kit':'VOI no detectadas'
            })['n_documento']#.drop(['No amplifica','Indeterminado'], axis=1)

0       1
1       2
2       3
3       4
4       5
     ... 
57    215
58    221
59    226
60    227
61    228
Name: n_documento, Length: 62, dtype: int64

In [190]:
df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'variante_linaje','sexo']).count()

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,n_documento,tipo_documento,clasificacion_linaje,pango,tecnica,tipo_de_caso,folio_epivigila,nombre_completo,nacionalidad,estado_paciente,...,nombre_vacuna_3,vacuna_previo_a_ftm,informe,emisor_de_informe,embarazo,comorbilidad,fis,frs,id_pntm,region_de_notificacion
fecha_resultado_secuenciacion_genotipificacion,variante_linaje,sexo,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1
2021-03-21,B.1.1.348,FEMENINO,1,0,1,1,1,1,1,1,1,0,...,0,1,1,1,0,0,1,0,0,1
2021-03-21,N.4,FEMENINO,1,0,1,1,1,1,1,1,1,0,...,1,1,1,1,0,0,1,0,0,1
2021-04-05,B.1.1,FEMENINO,1,0,1,1,1,1,1,1,1,0,...,0,1,1,1,0,0,1,0,0,1
2021-04-05,B.1.1.348,FEMENINO,1,0,1,1,1,1,1,1,1,0,...,0,1,1,1,0,0,1,0,0,1
2021-04-08,NO AMPLIFICA,FEMENINO,1,0,1,1,1,1,1,1,1,0,...,0,1,1,1,0,0,1,0,0,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2021-08-26,GAMMA,MASCULINO,3,0,3,3,3,3,3,3,3,3,...,0,3,3,3,0,1,3,3,0,3
2021-09-01,GAMMA,FEMENINO,2,2,2,2,2,2,2,2,2,2,...,0,2,2,2,1,1,2,2,0,2
2021-09-01,GAMMA,MASCULINO,3,3,3,3,3,3,3,3,3,3,...,0,3,3,3,0,0,3,3,0,3
2021-09-01,LAMBDA,FEMENINO,1,1,1,1,1,1,1,1,1,1,...,0,1,1,1,0,1,1,1,0,1


In [191]:
df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'variante_linaje','edad']).count()

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,n_documento,tipo_documento,clasificacion_linaje,pango,tecnica,tipo_de_caso,folio_epivigila,nombre_completo,nacionalidad,estado_paciente,...,nombre_vacuna_3,vacuna_previo_a_ftm,informe,emisor_de_informe,embarazo,comorbilidad,fis,frs,id_pntm,region_de_notificacion
fecha_resultado_secuenciacion_genotipificacion,variante_linaje,edad,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1
2021-03-21,B.1.1.348,52,1,0,1,1,1,1,1,1,1,0,...,0,1,1,1,0,0,1,0,0,1
2021-03-21,N.4,67,1,0,1,1,1,1,1,1,1,0,...,1,1,1,1,0,0,1,0,0,1
2021-04-05,B.1.1,35,1,0,1,1,1,1,1,1,1,0,...,0,1,1,1,0,0,1,0,0,1
2021-04-05,B.1.1.348,61,1,0,1,1,1,1,1,1,1,0,...,0,1,1,1,0,0,1,0,0,1
2021-04-08,NO AMPLIFICA,SIN DATOS,1,0,1,1,1,1,1,1,1,0,...,0,1,1,1,0,0,1,0,0,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2021-09-01,GAMMA,43,1,1,1,1,1,1,1,1,1,1,...,0,1,1,1,0,0,1,1,0,1
2021-09-01,GAMMA,44,1,1,1,1,1,1,1,1,1,1,...,0,1,1,1,0,0,1,1,0,1
2021-09-01,GAMMA,61,1,1,1,1,1,1,1,1,1,1,...,0,1,1,1,0,1,1,1,0,1
2021-09-01,LAMBDA,61,1,1,1,1,1,1,1,1,1,1,...,0,1,1,1,0,1,1,1,0,1


In [210]:
df_variantes_clean['edad'] = pd.to_numeric(df_variantes_clean['edad'],errors='coerce')



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



In [211]:
bins = pd.IntervalIndex.from_tuples([(0, 4), 
                                     (5, 9), 
                                     (10, 14),
                                     (15, 19),
                                     (20, 24), 
                                     (25, 29), 
                                     (30, 34),
                                     (35, 39),
                                     (40, 44), 
                                     (45, 49), 
                                     (50, 54),
                                     (55, 59),
                                     (60, 64), 
                                     (65, 69), 
                                     (70, 74),
                                     (75, 79),
                                     (80, 120)
                                    ])

df_variantes_clean['rango_edad'] = pd.cut(df_variantes_clean['edad'],bins, labels=True)



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



In [223]:
bins2 = pd.IntervalIndex.from_tuples([(0, 9), 
                                     (10, 19),
                                     (20, 29), 
                                     (30, 39),
                                     (40, 49), 
                                     (50, 59),
                                     (60, 69), 
                                     (70, 79),
                                     (80, 120)
                                    ])

df_variantes_clean['rango_edad_10'] = pd.cut(df_variantes_clean['edad'],bins2, labels=True)



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



In [212]:
df_variantes_clean['rango_edad']

0                NaN
1       (20.0, 24.0]
2       (40.0, 44.0]
3       (40.0, 44.0]
4       (40.0, 44.0]
           ...      
230     (75.0, 79.0]
231     (75.0, 79.0]
232    (80.0, 120.0]
233    (80.0, 120.0]
234    (80.0, 120.0]
Name: rango_edad, Length: 234, dtype: category
Categories (17, interval[int64]): [(0, 4] < (5, 9] < (10, 14] < (15, 19] ... (65, 69] < (70, 74] < (75, 79] < (80, 120]]

In [224]:
px.area(df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'rango_edad']).count()[['n_documento']].reset_index().pivot(
    index='fecha_resultado_secuenciacion_genotipificacion',
    columns='rango_edad', 
    values=['n_documento']
).fillna(0).cumsum()['n_documento'],
          labels={'rango_edad':'Rango de edad'},
        groupnorm='percent'
       ).update_layout(
    title= 'Variantes detectadas en la Región de Aysén',
    yaxis_title='% de casos identificados por variante',
    xaxis_title='Fecha de resultado de Secuenciación o Genotipificación',
    template='simple_white',   
)

In [227]:
px.area(df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'rango_edad_10']).count()[['n_documento']].reset_index().pivot(
    index='fecha_resultado_secuenciacion_genotipificacion',
    columns='rango_edad_10', 
    values=['n_documento']
).fillna(0).cumsum()['n_documento'],
          labels={'rango_edad_10':'Rango de edad'},
        groupnorm='percent'
       ).update_layout(
    title= 'Variantes detectadas en la Región de Aysén',
    yaxis_title='% de casos identificados de variantes por rango etareo',
    xaxis_title='Fecha de resultado de Secuenciación o Genotipificación',
    template='simple_white',   
)

In [230]:
px.area(df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'sexo']).count()[['n_documento']].reset_index().pivot(
    index='fecha_resultado_secuenciacion_genotipificacion',
    columns='sexo', 
    values=['n_documento']
).fillna(0).cumsum()['n_documento'],
          labels={'sexo':'Sexo'},
        groupnorm='percent'
       ).update_layout(
    title= 'Variantes detectadas en la Región de Aysén',
    yaxis_title='% de casos identificados de variantes por sexo',
    xaxis_title='Fecha de resultado de Secuenciación o Genotipificación',
    template='simple_white',   
)

In [232]:
px.area(df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'esquema_de_vacunacion_completo']).count()[['n_documento']].reset_index().pivot(
    index='fecha_resultado_secuenciacion_genotipificacion',
    columns='esquema_de_vacunacion_completo', 
    values=['n_documento']
).fillna(0).cumsum()['n_documento'],
          labels={'esquema_de_vacunacion_completo':'Vacunado'},
        groupnorm='percent'
       ).update_layout(
    title= 'Variantes detectadas en la Región de Aysén',
    yaxis_title='% de casos identificados de variantes segun vacunación',
    xaxis_title='Fecha de resultado de Secuenciación o Genotipificación',
    template='simple_white',   
)

In [None]:
presentacion_clinica

In [233]:
px.area(df_variantes_clean.groupby(['fecha_resultado_secuenciacion_genotipificacion', 'presentacion_clinica']).count()[['n_documento']].reset_index().pivot(
    index='fecha_resultado_secuenciacion_genotipificacion',
    columns='presentacion_clinica', 
    values=['n_documento']
).fillna(0).cumsum()['n_documento'],
          labels={'presentacion_clinica':'Sintomatotlogía'},
        groupnorm='percent'
       ).update_layout(
    title= 'Variantes detectadas en la Región de Aysén',
    yaxis_title='% de casos identificados de variantes segun vacunación',
    xaxis_title='Fecha de resultado de Secuenciación o Genotipificación',
    template='simple_white',   
)