# Visualizando datos de COVID-19, Exceso de Mortalidad y Movilidad

Actualización al 24 de marzo de 2021

In [1]:
# Dependencies
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
import numpy as np
import math
from scipy.stats import chisquare
#from benfordslaw import benfordslaw
from scipy.stats import chi2

import warnings
warnings.filterwarnings('ignore')

## Datos COVID-19

In [4]:
# 

Covid19 = pd.read_csv('Series_Casos_22.03.2021.csv', encoding = 'utf-8-sig')

Covid19.head()

Unnamed: 0,Fecha,Confirmados,Confirmados_Ing,Sospechosos,Defunciones_Sint,Defunciones_Muer
0,2020-01-01,0.0,0.0,132,0.0,0.0
1,2020-01-02,0.0,0.0,114,0.0,0.0
2,2020-01-03,0.0,0.0,113,0.0,0.0
3,2020-01-04,0.0,0.0,107,0.0,0.0
4,2020-01-05,0.0,0.0,163,0.0,0.0


In [5]:
# Nombres de las columnas
Covid19.columns

Index(['Fecha', 'Confirmados', 'Confirmados_Ing', 'Sospechosos',
       'Defunciones_Sint', 'Defunciones_Muer'],
      dtype='object')

## Datos Mortalidad - Defunciones

In [6]:
# 

Defunciones = pd.read_csv('Series_Defunciones.csv', encoding = 'utf-8-sig')

Defunciones.head()

Unnamed: 0,Fecha,Defunciones
0,2020-01-01,2436
1,2020-01-02,2481
2,2020-01-03,2226
3,2020-01-04,2271
4,2020-01-05,2335


In [7]:
# Nombres de las columnas
Defunciones.columns

Index(['Fecha', 'Defunciones'], dtype='object')

## Datos Mobility

In [None]:
# 

Defunciones = pd.read_csv('Series_Defunciones.csv', encoding = 'utf-8-sig')

Defunciones.head()

In [None]:
# Nombres de las columnas
Defunciones.columns

In [26]:
# Preparamos DataFrame's

conf = Serie_Confirmados[['Confirmados', 'Fecha']] # Fecha de síntomas

conf_b = Serie_Confirmados_B[['Confirmados_Ing', 'Fecha']] # Fecha de síntomas

defun_a = Serie_Defunciones_A[['Defunciones', 'Fecha']] # Fecha de síntomas

defun_b = Serie_Defunciones_B[['Defunciones', 'Fecha']] # Fecha de defunción

sosp = Serie_Sospechosos[['Sospechosos', 'Fecha']] # Fecha de síntomas

In [27]:
# Unimos las series: 

# Confirmados + Confirmados (con fecha de ingreso)
Series_Casos = pd.merge(conf, conf_b, how = 'outer', on = 'Fecha')

# Confirmados + Defunciones (con fecha de síntomas)
Series_Casos = pd.merge(Series_Casos, defun_a, how = 'outer', on = 'Fecha')

# Renombramos serie defunciones por fecha de síntomas
Series_Casos = Series_Casos.rename(columns = {'Defunciones': 'Defunciones_Sint'})

# Confirmados + Defunciones (con fecha de síntomas) + Defunciones (con fecha de muerte)
Series_Casos = pd.merge(Series_Casos, defun_b, how = 'outer', on = 'Fecha')

# Renombramos serie defunciones por fecha de muerte
Series_Casos = Series_Casos.rename(columns = {'Defunciones': 'Defunciones_Muer'})

# Confirmados + Defunciones (con fecha de síntomas) + Defunciones (con fecha de muerte) + Sospechosos
Series_Casos = pd.merge(Series_Casos, sosp, how = 'outer', on = 'Fecha')

#Series_Casos = Series_Casos.sort_values(by = 'Fecha', ascending = False)

Series_Casos.head()

Unnamed: 0,Confirmados,Fecha,Confirmados_Ing,Defunciones_Sint,Defunciones_Muer,Sospechosos
0,1.0,2020-01-22,,,,209
1,2.0,2020-02-19,,,,213
2,3.0,2020-02-20,1.0,,,173
3,2.0,2020-02-22,,,,222
4,1.0,2020-02-23,1.0,,,238


In [28]:
# Ordenamos y reemplazamos nulos por ceros (0)

Series_Casos = Series_Casos.fillna(0)

Series_Casos = Series_Casos.sort_values(by = 'Fecha', ascending = True).reset_index()

Series_Casos = Series_Casos[['Fecha', 'Confirmados', 'Confirmados_Ing', 'Sospechosos', 'Defunciones_Sint', 'Defunciones_Muer']]

Series_Casos

Unnamed: 0,Fecha,Confirmados,Confirmados_Ing,Sospechosos,Defunciones_Sint,Defunciones_Muer
0,2020-01-01,0.0,0.0,132,0.0,0.0
1,2020-01-02,0.0,0.0,114,0.0,0.0
2,2020-01-03,0.0,0.0,113,0.0,0.0
3,2020-01-04,0.0,0.0,107,0.0,0.0
4,2020-01-05,0.0,0.0,163,0.0,0.0
...,...,...,...,...,...,...
442,2021-03-18,1468.0,4046.0,827,6.0,224.0
443,2021-03-19,801.0,3022.0,744,2.0,143.0
444,2021-03-20,365.0,1294.0,415,2.0,114.0
445,2021-03-21,63.0,499.0,243,1.0,79.0


In [29]:
# Series TODAS

fig = go.Figure()

fig.add_trace( go.Scatter( x = Series_Casos['Fecha'], y = Series_Casos['Confirmados'], 
                          name = 'Confirmados', line_color = 'darkblue' ) )

fig.add_trace( go.Scatter( x = Series_Casos['Fecha'], y = Series_Casos['Sospechosos'], 
                          name = 'Sospechosos', line_color = 'orange' ) )

fig.add_trace( go.Scatter( x = Series_Casos['Fecha'], y = Series_Casos['Defunciones_Sint'], 
                          name = 'Defunciones por fecha de síntomas', line_color = 'darkred' ) )

fig.add_trace( go.Scatter( x = Series_Casos['Fecha'], y = Series_Casos['Defunciones_Muer'], 
                          name = 'Defunciones por fecha de muerte', line_color = 'darkgreen' ) )

fig.update_layout(template='plotly_white', # "plotly", "plotly_white", "ggplot2", "seaborn", "simple_white", "none"
                  title = 'Casos Confirmados y Sospechosos, y Defunciones (por fecha de síntomas y defunción)')

fig.update_xaxes(tickformat = '%Y-%m-%d') # (tickangle = 90, tickformat = '%Y-%m-%d')

fig.show()

In [30]:
# Series Confirmados

fig = go.Figure()

fig.add_trace( go.Scatter( x = Series_Casos['Fecha'], y = Series_Casos['Confirmados'], 
                          name = 'Confirmados', line_color = 'darkblue' ) )

fig.update_layout( template = 'plotly_white', # "plotly", "plotly_white", "ggplot2", "seaborn", "simple_white", "none"
                  barmode = 'overlay', 
                  title = { 'text': 'Casos confirmados por fecha de síntomas',
                           'y':0.9, 'x':0.5, 'xanchor': 'center', 'yanchor': 'top'}, 
                  font_family = 'Calibri Light')

fig.update_xaxes(tickformat = '%Y-%m-%d') # (tickangle = 90, tickformat = '%Y-%m-%d')

fig.show()

In [31]:
sum(Series_Casos['Confirmados'].fillna(0))

2197160.0

In [32]:
# Series Confirmados ACUMULADOS

fig = go.Figure()

fig.add_trace( go.Scatter( x = Series_Casos['Fecha'], y = Series_Casos['Confirmados'].cumsum(), 
                          name = 'Confirmados', line_color = 'darkblue' ) )

fig.update_layout( template = 'plotly_white', # "plotly", "plotly_white", "ggplot2", "seaborn", "simple_white", "none"
                  barmode = 'overlay', 
                  title = { 'text': 'Casos confirmados por fecha de síntomas',
                           'y':0.9, 'x':0.5, 'xanchor': 'center', 'yanchor': 'top'}, 
                  font_family = 'Calibri Light')

fig.update_xaxes(tickformat = '%Y-%m-%d') # (tickangle = 90, tickformat = '%Y-%m-%d')

fig.show()

In [33]:
Series_Casos.sum()

Confirmados         2197160.0
Confirmados_Ing     2197160.0
Sospechosos          358967.0
Defunciones_Sint     198239.0
Defunciones_Muer     198239.0
dtype: float64

In [34]:
# Series TODAS

fig = go.Figure()

fig.add_trace( go.Scatter( x = Series_Casos['Fecha'], y = Series_Casos['Defunciones_Sint'], 
                          name = 'Fecha de síntomas', line_color = 'darkred' ) )

fig.add_trace( go.Scatter( x = Series_Casos['Fecha'], y = Series_Casos['Defunciones_Muer'], 
                          name = 'Fecha de defunción', line_color = 'darkgreen' ) )

fig.update_layout( template = 'plotly_white', # "plotly", "plotly_white", "ggplot2", "seaborn", "simple_white", "none"
                  barmode = 'overlay', 
                  title = { 'text': 'Defunciones por fecha de síntomas y por fecha de defunción',
                           'y':0.9, 'x':0.5, 'xanchor': 'center', 'yanchor': 'top'}, 
                  font_family = 'Calibri Light')

fig.update_xaxes(tickformat = '%Y-%m-%d') # (tickangle = 90, tickformat = '%Y-%m-%d')

fig.show()

In [35]:
# Series TODAS ACUMULADAS

fig = go.Figure()

fig.add_trace( go.Scatter( x = Series_Casos['Fecha'], y = Series_Casos['Defunciones_Sint'].cumsum(), 
                          name = 'Fecha de síntomas', line_color = 'darkred' ) )

fig.add_trace( go.Scatter( x = Series_Casos['Fecha'], y = Series_Casos['Defunciones_Muer'].cumsum(), 
                          name = 'Fecha de defunción', line_color = 'darkgreen' ) )

fig.update_layout( template = 'plotly_white', # "plotly", "plotly_white", "ggplot2", "seaborn", "simple_white", "none"
                  barmode = 'overlay', 
                  title = { 'text': 'Defunciones por fecha de síntomas y por fecha de defunción',
                           'y':0.9, 'x':0.5, 'xanchor': 'center', 'yanchor': 'top'}, 
                  font_family = 'Calibri Light')

fig.update_xaxes(tickformat = '%Y-%m-%d') # (tickangle = 90, tickformat = '%Y-%m-%d')

fig.show()

## Definición y prueba de la Ley de Benford para el dígito 1 y 2

Ley de Benford para el primer digito o digito inicial si la probabilidad de observar el primer dígito $d$ es aproximadamente como describe la expresión:

$ Prob(D_1 = d_1) = log_{10} \left( \frac{d_1 + 1}{d_1} \right) $

Donde $d_1 = 1, 2, \ldots, 9$. La Ley de Benford se puede extender para determinar la probabilidad condicional del segundo dígito d_2, cuyos valores posibles son 9: 0, 1, 2,..., 9, y esta dada por:

$ Prob(D_2 = d_2 | D_1 = d_1) = log_{10} \left( 1 + \frac{1}{10 d_1 + d_2} \right) $

In [34]:
# Digito 1
d_1 = [ 1, 2, 3, 4, 5, 6, 7, 8, 9 ]

p_d_1 = [ 100 * math.log10( (d_1[0] + 1) / d_1[0] ),
         100 * math.log10( (d_1[1] + 1) / d_1[1] ), 
         100 * math.log10( (d_1[2] + 1) / d_1[2] ), 
         100 * math.log10( (d_1[3] + 1) / d_1[3] ), 
         100 * math.log10( (d_1[4] + 1) / d_1[4] ), 
         100 * math.log10( (d_1[5] + 1) / d_1[5] ), 
         100 * math.log10( (d_1[6] + 1) / d_1[6] ), 
         100 * math.log10( (d_1[7] + 1) / d_1[7] ), 
         100 * math.log10( (d_1[8] + 1) / d_1[8] ) ]

#d_1, p_d_1

Benford_Law_1 = pd.DataFrame( {'d_1': d_1 , 'p_d_1': p_d_1} )
#Benford_Law_1

In [35]:
# Digito 2
d_2 = [ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 ]

P_d_2 = [] 

for d in d_2:
    p_d_2 =  math.log10( 1 + ( 1 / (10 * d_1[0] + d_2[d] ) ) ) + \
             math.log10( 1 + ( 1 / (10 * d_1[1] + d_2[d] ) ) ) + \
             math.log10( 1 + ( 1 / (10 * d_1[2] + d_2[d] ) ) ) + \
             math.log10( 1 + ( 1 / (10 * d_1[3] + d_2[d] ) ) ) + \
             math.log10( 1 + ( 1 / (10 * d_1[4] + d_2[d] ) ) ) + \
             math.log10( 1 + ( 1 / (10 * d_1[5] + d_2[d] ) ) ) + \
             math.log10( 1 + ( 1 / (10 * d_1[6] + d_2[d] ) ) ) + \
             math.log10( 1 + ( 1 / (10 * d_1[7] + d_2[d] ) ) ) + \
             math.log10( 1 + ( 1 / (10 * d_1[8] + d_2[d] ) ) ) 
    
    P_d_2.append(100 * p_d_2)

#d_2, P_d_2

Benford_Law_2 = pd.DataFrame( {'d_2': d_2 , 'p_d_2': P_d_2} )
#Benford_Law_2

In [36]:
# Primer y  Segundo Digito
fig = go.Figure()

fig.add_trace(go.Bar( x = Benford_Law_1['d_1'], y = Benford_Law_1['p_d_1'], 
                     name = 'Primer Dìgito', 
                     marker_color = 'darkblue' ))

fig.add_trace(go.Bar( x = Benford_Law_2['d_2'], y = Benford_Law_2['p_d_2'], 
                     name = 'Segundo Dìgito', 
                     marker_color = 'darkred' ))

fig.update_layout( template = 'plotly_white', # "plotly", "plotly_white", "ggplot2", "seaborn", "simple_white", "none"
                  barmode = 'overlay', 
                  title = { 'text': 'Probabilidad de la Ley de Benford para primer y segundo digitos',
                           'y':0.9, 'x':0.5, 'xanchor': 'center', 'yanchor': 'top'}, 
                  font_family = 'Calibri Light', xaxis = dict( tickmode = 'linear'))

fig.update_layout( barmode = 'group' )

fig.show()

La prueba de para el primer y segundo dígitos está basada en una prueba Chi-cuadrado de Pearson con 8 grados de libertad para el primer caso y de 9 grados de libertad para el segundo. La prueba busca mostrar si la suma de las desviaciones cuadradas entre las frecuencias relativas observadas ($h_i$) y las probabilidades bajo la hipótesis nula ($p_i$) son significativamente diferentes de cero. Denotemos el tamaño de la muestra por $N$, así el estadístico de prueba para el primer dígito estará dado por:

$\chi^2_{1d} = N \sum_{j = 1}^9 \frac{(h_i - p_1)^2}{p_i}$

$\chi^2_{2d} = N \sum_{j = 0}^9 \frac{(h_i - p_1)^2}{p_i}$

In [37]:
# Function that evaluate a vector with Benford's Law
def Benford(Vector):
    """ Función que determina si un vector de datos cumple con la Ley de Benford
    """
    # Definición de valores de Benford:
    
    BL_1 = pd.DataFrame( {'d_1': [ 1, 2, 3, 4, 5, 6, 7, 8, 9 ] , 
                          'p_d_1': [30.1030, 17.6091, 12.4939, 9.6910, 7.9181, 6.6947, 
                                    5.7992, 5.1153, 4.5757]} )
    BL_1['p_d_1'] = BL_1['p_d_1']/100
    
    BL_2 = pd.DataFrame( {'d_1': [ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 ],
                          'p_d_2': [11.9679, 11.3890, 10.8821, 10.4330, 10.0308, 9.6677, 
                                    9.3375, 9.0352, 8.7570, 8.4997]} ) 
    BL_2['p_d_2'] = BL_2['p_d_2']/100

    # Digito 1
    Digit_1 = []

    for case in Vector:
        if case > 0:
            str_case = str(case)
            #
            Digit_1.append( int(str_case[0]) )
    #
    Digit_1 = pd.DataFrame( Digit_1 , columns = ['fd_1'] )
    #
    Digit_1 = Digit_1['fd_1'].value_counts()
    #
    Digit_1 = pd.DataFrame( Digit_1 , columns = ['fd_1'] )
    #
    Digit_1['pd_1'] = ( Digit_1['fd_1'] / Digit_1['fd_1'].sum() ) #100*( Digit_1['fd_1'] / Digit_1['fd_1'].sum() )
    #
    Digit_1 = Digit_1.reset_index().sort_values(by = ['index'])
    #
    Table_1 = pd.DataFrame( {'index': [ 1, 2, 3, 4, 5, 6, 7, 8, 9 ]} )
    #
    Digit_1 = Table_1.merge(Digit_1, how = 'left', on = 'index').sort_values(by = ['index']).fillna(0)
    #
    Chi = []
    for i in range(0, 9):
        Chi.append( (( Digit_1['pd_1'][i] - BL_1['p_d_1'][i] )**2) / BL_1['p_d_1'][i] )
    Digit_1['Chi'] = Chi
    # 
    Chi_d1 = Digit_1['fd_1'].sum() * Digit_1['Chi'].sum()
    #
    N1 = Digit_1['fd_1'].sum()    
    
    # Digito 2
    Digit_2 = []

    for case in Vector:
        if case >= 10:
            str_case = str(case)
            Digit_2.append( int(str_case[1]) )
                
    #
    Digit_2 = pd.DataFrame( Digit_2 , columns = ['fd_2'] )
    #
    Digit_2 = Digit_2['fd_2'].value_counts()
    #
    Digit_2 = pd.DataFrame( Digit_2 , columns = ['fd_2'] )
    #
    Digit_2['pd_2'] = ( Digit_2['fd_2'] / Digit_2['fd_2'].sum() ) #100*( Digit_2['fd_2'] / Digit_2['fd_2'].sum() )
    #
    Digit_2 = Digit_2.reset_index().sort_values(by = ['index'])
    #
    Table_2 = pd.DataFrame( {'index': [ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 ]} )
    #
    Digit_2 = Table_2.merge(Digit_2, how = 'left', on = 'index').sort_values(by = ['index']).fillna(0)
    #
    Chi = []
    for i in range(0, 10):
        Chi.append( (( Digit_2['pd_2'][i] - BL_2['p_d_2'][i] )**2) / BL_2['p_d_2'][i] )
    Digit_2['Chi'] = Chi
    # 
    Chi_d2 = Digit_2['fd_2'].sum() * Digit_2['Chi'].sum()
    #
    N2 = Digit_2['fd_2'].sum()

    ######
    return Digit_1, Chi_d1, N1, Digit_2, Chi_d2, N2

### Pruebas de Benford a nivel Nacional (Series Diarias)

In [38]:
# Aplicando Benford a la serie de confirmados

DF_1, C_1, N_1, DF_2, C_2, N_2 = Benford(Series_Casos[Series_Casos['Fecha'] > '2020-01-01']['Confirmados']) #.cumsum())

C_1, 1 - chi2.cdf(C_1, 8), C_2, 1 - chi2.cdf(C_2, 9)

(155.05153150854028, 0.0, 6.500055451799953, 0.6890133013444837)

In [99]:
# Primer Digito
fig = go.Figure()

fig.add_trace(go.Bar( x = Benford_Law_1['d_1'], y = Benford_Law_1['p_d_1'], 
                     name = 'Ley de Benford', 
                     marker_color = 'darkblue' ))

fig.add_trace(go.Bar( x = DF_1['index'], y = DF_1['pd_1']*100, 
                     name = 'Probabilidad observada', 
                     marker_color = 'darkred' ))

fig.update_layout( template = 'plotly_white', # "plotly", "plotly_white", "ggplot2", "seaborn", "simple_white", "none"
                  barmode = 'overlay', 
                  title = { 'text': 'Aplicación de la Ley de Benford para el primer digito para casos confirmados',
                           'y':0.9, 'x':0.5, 'xanchor': 'center', 'yanchor': 'top'}, 
                  yaxis = dict( title = '%' ),
                  font_family = 'Calibri Light', xaxis = dict( tickmode = 'linear'))

fig.update_layout( barmode = 'group' )

fig.show()

In [100]:
# Segundo Digito
fig = go.Figure()

fig.add_trace(go.Bar( x = Benford_Law_2['d_2'], y = Benford_Law_2['p_d_2'], 
                     name = 'Ley de Benford', 
                     marker_color = 'darkblue' ))

fig.add_trace(go.Bar( x = DF_2['index'], y = DF_2['pd_2']*100, 
                     name = 'Probabilidad observada', 
                     marker_color = 'darkred' ))

fig.update_layout( template = 'plotly_white', # "plotly", "plotly_white", "ggplot2", "seaborn", "simple_white", "none"
                  barmode = 'overlay', 
                  title = { 'text': 'Aplicación de la Ley de Benford para el segundo digito para casos confirmados',
                           'y':0.9, 'x':0.5, 'xanchor': 'center', 'yanchor': 'top'}, 
                  yaxis = dict( title = '%' ), 
                  font_family = 'Calibri Light', xaxis = dict( tickmode = 'linear'))

fig.update_layout( barmode = 'group' )

fig.show()

In [101]:
# Aplicando Benford a la serie de defunciones por fecha de síntomas

DF_1, C_1, N_1, DF_2, C_2, N_2 = Benford(Series_Casos[Series_Casos['Fecha'] > '2020-01-01']['Defunciones_Sint']) #.cumsum())

C_1, 1 - chi2.cdf(C_1, 8), C_2, 1 - chi2.cdf(C_2, 9)

(129.46934140168392, 0.0, 9.987093364916312, 0.35153109129159854)

In [102]:
# Primer Digito
fig = go.Figure()

fig.add_trace(go.Bar( x = Benford_Law_1['d_1'], y = Benford_Law_1['p_d_1'], 
                     name = 'Ley de Benford', 
                     marker_color = 'darkblue' ))

fig.add_trace(go.Bar( x = DF_1['index'], y = DF_1['pd_1']*100, 
                     name = 'Probabilidad observada', 
                     marker_color = 'darkred' ))

fig.update_layout( template = 'plotly_white', # "plotly", "plotly_white", "ggplot2", "seaborn", "simple_white", "none"
                  barmode = 'overlay', 
                  title = { 'text': 'Aplicación de la Ley de Benford para el primer digito para defunciones por fecha de síntomas',
                           'y':0.9, 'x':0.5, 'xanchor': 'center', 'yanchor': 'top'}, 
                  yaxis = dict( title = '%' ), 
                  font_family = 'Calibri Light', xaxis = dict( tickmode = 'linear'))

fig.update_layout( barmode = 'group' )

fig.show()

In [103]:
# Segundo Digito
fig = go.Figure()

fig.add_trace(go.Bar( x = Benford_Law_2['d_2'], y = Benford_Law_2['p_d_2'], 
                     name = 'Ley de Benford', 
                     marker_color = 'darkblue' ))

fig.add_trace(go.Bar( x = DF_2['index'], y = DF_2['pd_2']*100, 
                     name = 'Probabilidad observada', 
                     marker_color = 'darkred' ))

fig.update_layout( template = 'plotly_white', # "plotly", "plotly_white", "ggplot2", "seaborn", "simple_white", "none"
                  barmode = 'overlay', 
                  title = { 'text': 'Aplicación de la Ley de Benford para el segundo digito para defunciones por fecha de síntomas',
                           'y':0.9, 'x':0.5, 'xanchor': 'center', 'yanchor': 'top'}, 
                  yaxis = dict( title = '%' ), 
                  font_family = 'Calibri Light', xaxis = dict( tickmode = 'linear'))

fig.update_layout( barmode = 'group' )

fig.show()

In [104]:
# Aplicando Benford a la serie de defunciones por fecha de muerte

DF_1, C_1, N_1, DF_2, C_2, N_2 = Benford(Series_Casos[Series_Casos['Fecha'] > '2020-01-01']['Defunciones_Muer']) #.cumsum())

C_1, 1 - chi2.cdf(C_1, 8), C_2, 1 - chi2.cdf(C_2, 9)

(206.66753802856454, 0.0, 4.343959796705355, 0.8873518509311658)

In [105]:
# Primer Digito
fig = go.Figure()

fig.add_trace(go.Bar( x = Benford_Law_1['d_1'], y = Benford_Law_1['p_d_1'], 
                     name = 'Ley de Benford', 
                     marker_color = 'darkblue' ))

fig.add_trace(go.Bar( x = DF_1['index'], y = DF_1['pd_1']*100, 
                     name = 'Probabilidad observada', 
                     marker_color = 'darkred' ))

fig.update_layout( template = 'plotly_white', # "plotly", "plotly_white", "ggplot2", "seaborn", "simple_white", "none"
                  barmode = 'overlay', 
                  title = { 'text': 'Aplicación de la Ley de Benford para el primer digito defunciones por fecha de muerte',
                           'y':0.9, 'x':0.5, 'xanchor': 'center', 'yanchor': 'top'}, 
                  yaxis = dict( title = '%' ), 
                  font_family = 'Calibri Light', xaxis = dict( tickmode = 'linear'))

fig.update_layout( barmode = 'group' )

fig.show()

In [106]:
# Segundo Digito
fig = go.Figure()

fig.add_trace(go.Bar( x = Benford_Law_2['d_2'], y = Benford_Law_2['p_d_2'], 
                     name = 'Ley de Benford', 
                     marker_color = 'darkblue' ))

fig.add_trace(go.Bar( x = DF_2['index'], y = DF_2['pd_2']*100, 
                     name = 'Probabilidad observada', 
                     marker_color = 'darkred' ))

fig.update_layout( template = 'plotly_white', # "plotly", "plotly_white", "ggplot2", "seaborn", "simple_white", "none"
                  barmode = 'overlay', 
                  title = { 'text': 'Aplicación de la Ley de Benford para el segundo digito para defunciones por fecha de muerte',
                           'y':0.9, 'x':0.5, 'xanchor': 'center', 'yanchor': 'top'}, 
                  yaxis = dict( title = '%' ), 
                  font_family = 'Calibri Light', xaxis = dict( tickmode = 'linear'))

fig.update_layout( barmode = 'group' )

fig.show()

In [97]:
#

Todos = Series_Casos[Series_Casos['Fecha'] > '2020-01-01']['Confirmados'].append(Series_Casos[Series_Casos['Fecha'] > '2020-01-01']['Defunciones_Sint'], ignore_index = True)

Todos = Todos.append(Series_Casos[Series_Casos['Fecha'] > '2020-01-01']['Defunciones_Muer'], ignore_index = True)

#Todos

In [51]:
# Aplicando Benford a la serie de confirmados, defunciones

DF_1, C_1, N_1, DF_2, C_2, N_2 = Benford(Todos) #.cumsum())

C_1, 1 - chi2.cdf(C_1, 8), C_2, 1 - chi2.cdf(C_2, 9)

(441.10607980534905, 0.0, 5.9257923423069006, 0.7473217455236143)

In [52]:
# Primer Digito
fig = go.Figure()

fig.add_trace(go.Bar( x = Benford_Law_1['d_1'], y = Benford_Law_1['p_d_1'], 
                     name = 'Ley de Benford', 
                     marker_color = 'darkblue' ))

fig.add_trace(go.Bar( x = DF_1['index'], y = DF_1['pd_1']*100, 
                     name = 'Probabilidad observada', 
                     marker_color = 'darkred' ))

fig.update_layout( template = 'plotly_white', # "plotly", "plotly_white", "ggplot2", "seaborn", "simple_white", "none"
                  barmode = 'overlay', 
                  title = { 'text': 'Aplicación de la Ley de Benford para el primer digito defunciones por fecha de muerte',
                           'y':0.9, 'x':0.5, 'xanchor': 'center', 'yanchor': 'top'}, 
                  yaxis = dict( title = '%' ), 
                  font_family = 'Calibri Light', xaxis = dict( tickmode = 'linear'))

fig.update_layout( barmode = 'group' )

fig.show()

In [53]:
# Segundo Digito
fig = go.Figure()

fig.add_trace(go.Bar( x = Benford_Law_2['d_2'], y = Benford_Law_2['p_d_2'], 
                     name = 'Ley de Benford', 
                     marker_color = 'darkblue' ))

fig.add_trace(go.Bar( x = DF_2['index'], y = DF_2['pd_2']*100, 
                     name = 'Probabilidad observada', 
                     marker_color = 'darkred' ))

fig.update_layout( template = 'plotly_white', # "plotly", "plotly_white", "ggplot2", "seaborn", "simple_white", "none"
                  barmode = 'overlay', 
                  title = { 'text': 'Aplicación de la Ley de Benford para el segundo digito para defunciones por fecha de muerte',
                           'y':0.9, 'x':0.5, 'xanchor': 'center', 'yanchor': 'top'}, 
                  yaxis = dict( title = '%' ), 
                  font_family = 'Calibri Light', xaxis = dict( tickmode = 'linear'))

fig.update_layout( barmode = 'group' )

fig.show()

In [54]:
# To CSV:

Series_Casos.to_csv('Series_Casos_' + Fecha + '.csv', index = False, encoding = 'utf-8-sig')