## Jacknife

El método Jacknife fue propuesto para estimar errores estándar y sesgos.

Dada una variable muestral $X_j=(x_{j}, x_{2j},..., x_{nj})^t\hspace{0.2cm}$  y un estidímador $\hspace{0.2cm}\widehat{\theta}= f(X_j)$ del parametro poblacional $\theta$

El sesgo del estimador $\widehat{\theta}$ se define como:

$$Sesgo(\widehat{\theta}) = E \left[ \hspace{0.05cm} \widehat{\theta} \hspace{0.05cm} \right]- \theta$$

La varianza del estimador $\widehat{\theta}$ se define como:

$$Var(\widehat{\theta}) = E \left[ \hspace{0.05cm} \left( \widehat{\theta} - E [ \hspace{0.05cm} \widehat{\theta} \hspace{0.05cm}  ] \right)^2 \hspace{0.05cm} \right]$$

El error estandar (desviación típica) del estimador $\widehat{\theta}$ se define como:

$$s.e.(\widehat{\theta}) = \sqrt{Var(\widehat{\theta})}$$

Se define la muestra $r$-esima de $X_j$ como:

$$X_{(r)j} = (x_{1j}, x_{2j},..,x_{r-1,j},x_{r+1,j} ,.., x_{nj}) \hspace{0.4cm}$$  

para  $\hspace{0.2cm} r=1,...,n$

Se define la replica $r$-esima del estimador $\widehat{\theta}$ como:

$$\hat{\theta}_{(r)} = f(X_{(r)j})$$

El **estimador Jacknife** del **sesgo** del estimador $\widehat{\theta}$ se define como:

$$\widehat{Sesgo}(\widehat{\theta})_{Jack} =  (n-1) \cdot \left(  \widehat{\theta}_{(\cdot)} - \widehat{\theta} \right)$$

Donde: 

$$\widehat{\theta}_{(\cdot)} = \dfrac{1}{n} \cdot \sum_{r=1}^{n} \widehat{\theta}_{(r)}$$

El **estimador Jacknife** de la **varianza** del estimador $\widehat{\theta}$ se define como:

$$\widehat{ Var}(\widehat{\theta})_{Jack} =  \dfrac{n-1}{n} \cdot \sum_{r=1}^{n} \left( \widehat{\theta}_{(r)} - \dfrac{1}{n} \sum_{r=1}^{n} \widehat{\theta}_{(r)}  \right)^2$$

El **estimador Jacknife** del **error estandar** del estimador $\widehat{\theta}$ se define como:

$$\widehat{ s.e.}(\widehat{\theta})_{Jack} = \sqrt{ \dfrac{n-1}{n} \cdot \sum_{r=1}^{n} \left( \widehat{\theta}_{(r)} - \dfrac{1}{n} \sum_{r=1}^{n} \widehat{\theta}_{(r)}  \right)^2}$$

**Observación:**

El Jacknife funciona bien cuando el estimador es suave (smooth). 

Un estimador es suave cuando ante pequeños cambios en la muestra de datos genera pequeños cambios en el estimador.

Ejemplo de estimador suave es el estimador plug-in de la media poblacional, es decir la media muestral.

Ejemplo de estimador no suave es el estimador plug-in de la mediana poblacional, es decir la mediana muestral

**Estimación Jacknife con corrección de sesgo**

\begin{gather*}
\widehat{\theta}_{Jack} \hspace{0.2cm}=\hspace{0.2cm} \widehat{\theta} \hspace{0.1cm}-\hspace{0.1cm} \widehat{Sesgo}(\widehat{\theta})_{Jack} \\ \\ \hspace{0.5cm}=\hspace{0.2cm} \widehat{\theta} -  (n-1) \cdot \left(  \widehat{\theta}_{(\cdot)} - \widehat{\theta} \right) \\  \\ \hspace{0.4cm}=\hspace{0.2cm}   n\cdot \widehat{\theta} - (n-1)\cdot \widehat{\theta}_{(\cdot)}
\end{gather*}

### Aplicación del Jacknife en `Python`

In [2]:
import numpy as np

In [3]:
np.random.seed(123)

Xj = np.random.normal(loc=10, scale=15, size=50)

In [4]:
Xj

array([ -6.28445905,  24.9601817 ,  14.24467747, -12.59442071,
         1.32099622,  34.77154806, -26.40018865,   3.56631057,
        28.98904388,  -3.00110603,  -0.18329227,   8.57936547,
        32.37084439,   0.41647005,   3.34027061,   3.48473087,
        43.08895124,  42.80179133,  25.06080847,  15.79279599,
        21.06052864,  32.36098042,  -4.03750803,  27.63743567,
        -8.80821002,   0.43372746,  23.60657794, -11.4302105 ,
         7.8989692 ,  -2.92632344,   6.16570944, -31.97883658,
       -16.57299657,  -0.49815852,  23.91193648,   7.39546476,
        10.04268874,  20.32334067,  -3.19304515,  14.25440986,
        -2.08049777, -15.91504241,   4.13650309,  18.60708794,
        15.07883576,   9.82254258,  45.88547899,  16.1936824 ,
        24.68104009,  43.57215008])

In [5]:
np.delete(Xj, 1)

array([ -6.28445905,  14.24467747, -12.59442071,   1.32099622,
        34.77154806, -26.40018865,   3.56631057,  28.98904388,
        -3.00110603,  -0.18329227,   8.57936547,  32.37084439,
         0.41647005,   3.34027061,   3.48473087,  43.08895124,
        42.80179133,  25.06080847,  15.79279599,  21.06052864,
        32.36098042,  -4.03750803,  27.63743567,  -8.80821002,
         0.43372746,  23.60657794, -11.4302105 ,   7.8989692 ,
        -2.92632344,   6.16570944, -31.97883658, -16.57299657,
        -0.49815852,  23.91193648,   7.39546476,  10.04268874,
        20.32334067,  -3.19304515,  14.25440986,  -2.08049777,
       -15.91504241,   4.13650309,  18.60708794,  15.07883576,
         9.82254258,  45.88547899,  16.1936824 ,  24.68104009,
        43.57215008])

In [76]:
def Jacknife(Xj , estimador, q=0.75):

#######################################################

    if estimador == 'median':

        def Jacknife_sample(Xj , r):

            Xj_sample_r = np.delete(Xj, r)

            return(Xj_sample_r)

        
        replicas_estimador = []

        for r in range(0, len(Xj)):

            replicas_estimador.append( np.median( Jacknife_sample(Xj , r) ) )

    
        n = len(Xj)

        sesgo = (n-1) * ( np.mean( replicas_estimador ) - np.median(Xj) )

        estimacion_sesgo_corregido = n*np.median(Xj) - (n-1)*np.mean( replicas_estimador )

        standard_error = np.sqrt( ((n-1)/n) * sum( (replicas_estimador - np.mean( replicas_estimador ))**2 ) )

 #######################################################   

    if estimador == 'mean':

        def Jacknife_sample(Xj , r):

            Xj_sample_r = np.delete(Xj, r)

            return(Xj_sample_r)

        
        replicas_estimador = []

        for r in range(0, len(Xj)):

            replicas_estimador.append( np.mean( Jacknife_sample(Xj , r) ) )

    
        n = len(Xj)

        sesgo = (n-1) * ( np.mean( replicas_estimador ) - np.mean(Xj) )

        estimacion_sesgo_corregido = n*np.mean(Xj) - (n-1)*np.mean( replicas_estimador )

        standard_error = np.sqrt( ((n-1)/n) * sum( (replicas_estimador - np.mean( replicas_estimador ))**2 ) )


#######################################################

    if estimador == 'std':

        def Jacknife_sample(Xj , r):

            Xj_sample_r = np.delete(Xj, r)

            return(Xj_sample_r)

        
        replicas_estimador = []

        for r in range(0, len(Xj)):

            replicas_estimador.append( np.std( Jacknife_sample(Xj , r) ) )

    
        n = len(Xj)

        sesgo = (n-1) * ( np.mean( replicas_estimador ) - np.std(Xj) )

        estimacion_sesgo_corregido = n*np.std(Xj) - (n-1)*np.mean( replicas_estimador )

        standard_error = np.sqrt( ((n-1)/n) * sum( (replicas_estimador - np.mean( replicas_estimador ))**2 ) )


#######################################################

    if estimador == 'quantile':

        def Jacknife_sample(Xj , r):

            Xj_sample_r = np.delete(Xj, r)

            return(Xj_sample_r)

        
        replicas_estimador = []

        for r in range(0, len(Xj)):

            replicas_estimador.append( np.quantile( Jacknife_sample(Xj , r) , q) )

    
        n = len(Xj)

        sesgo = (n-1) * ( np.mean( replicas_estimador ) - np.quantile(Xj , q) )

        estimacion_sesgo_corregido = n*np.quantile(Xj , q) - (n-1)*np.mean( replicas_estimador )

        standard_error = np.sqrt( ((n-1)/n) * sum( (replicas_estimador - np.mean( replicas_estimador ))**2 ) )

#######################################################

    if estimador == 'kurtosis':

        import scipy

        from scipy.stats import  kurtosis

        def Jacknife_sample(Xj , r):

            Xj_sample_r = np.delete(Xj, r)

            return(Xj_sample_r)

        
        replicas_estimador = []

        for r in range(0, len(Xj)):

            replicas_estimador.append( kurtosis(Xj) )

    
        n = len(Xj)

        sesgo = (n-1) * ( np.mean( replicas_estimador ) - kurtosis(Xj) )

        estimacion_sesgo_corregido = n*kurtosis(Xj) - (n-1)*np.mean( replicas_estimador )

        standard_error = np.sqrt( ((n-1)/n) * sum( (replicas_estimador - np.mean( replicas_estimador ))**2 ) )


#######################################################
     
#######################################################

    if estimador == 'asimetria':

        import scipy

        from scipy.stats import  skew

        def Jacknife_sample(Xj , r):

            Xj_sample_r = np.delete(Xj, r)

            return(Xj_sample_r)

        
        replicas_estimador = []

        for r in range(0, len(Xj)):

            replicas_estimador.append( skew(Xj) )

    
        n = len(Xj)

        sesgo = (n-1) * ( np.mean( replicas_estimador ) - skew(Xj) )

        estimacion_sesgo_corregido = n*skew(Xj) - (n-1)*np.mean( replicas_estimador )

        standard_error = np.sqrt( ((n-1)/n) * sum( (replicas_estimador - np.mean( replicas_estimador ))**2 ) )


#######################################################
    
    return(sesgo, estimacion_sesgo_corregido, standard_error)


In [71]:
import scipy

from scipy.stats import  kurtosis

In [73]:
kurtosis(Xj)

-0.37420768292897266

In [7]:
sesgo, estimacion_sesgo_corregido, standard_error = Jacknife(Xj , 'median', q=0.75)

In [8]:
sesgo

8.704148513061227e-14

In [9]:
estimacion_sesgo_corregido

8.239167331558235

In [10]:
standard_error

2.381386940718188

In [53]:
sesgo, estimacion_sesgo_corregido, standard_error = Jacknife(Xj , 'mean', q=0.75)

In [54]:
sesgo

-8.704148513061227e-14

In [55]:
estimacion_sesgo_corregido

10.199071616256902

In [56]:
standard_error

2.5491917443460235

In [63]:
sesgo, estimacion_sesgo_corregido, standard_error = Jacknife(Xj , 'std')

In [64]:
np.std(Xj)

17.844342210422187

In [65]:
sesgo

-0.26116994703598806

In [66]:
estimacion_sesgo_corregido

18.10551215745818

In [67]:
standard_error

1.6795955569730596

In [15]:
sesgo, estimacion_sesgo_corregido, standard_error = Jacknife(Xj , 'quantile', q=0.75)

In [19]:
np.quantile(Xj, 0.75)

23.835596841535178

In [16]:
sesgo

-0.14962568429344003

In [17]:
estimacion_sesgo_corregido

23.985222525828704

In [18]:
standard_error

0.9375849844484524

In [20]:
sesgo, estimacion_sesgo_corregido, standard_error = Jacknife(Xj , 'quantile', q=0.25)

In [24]:
np.quantile(Xj, 0.25)

-1.6849129579803668

In [21]:
sesgo

0.7753462334875716

In [22]:
estimacion_sesgo_corregido

-2.460259191467941

In [23]:
standard_error

4.858477270796004

In [25]:
sesgo, estimacion_sesgo_corregido, standard_error = Jacknife(Xj , 'quantile', q=0.10)

In [29]:
np.quantile(Xj, 0.10)

-11.546631523927719

In [26]:
sesgo

7.770186286477228

In [27]:
estimacion_sesgo_corregido

-19.31681781040504

In [28]:
standard_error

5.217098648611869

In [30]:
sesgo, estimacion_sesgo_corregido, standard_error = Jacknife(Xj , 'quantile', q=0.90)

In [34]:
np.quantile(Xj, 0.90)

32.61091475832362

In [31]:
sesgo

9.364358252194954

In [32]:
estimacion_sesgo_corregido

23.246556506128627

In [33]:
standard_error

1.0245278739126102

In [77]:
sesgo, estimacion_sesgo_corregido, standard_error = Jacknife(Xj , 'kurtosis')

In [78]:
sesgo

0.0

In [79]:
estimacion_sesgo_corregido

-0.3742076829289722

In [80]:
standard_error

0.0

In [81]:
sesgo, estimacion_sesgo_corregido, standard_error = Jacknife(Xj , 'asimetria')

In [82]:
sesgo

-1.700029006457271e-16

In [83]:
estimacion_sesgo_corregido

0.025587358812510397

In [84]:
standard_error

2.42861286636753e-17