# Superación del problema de las estimaciones sesgadas en el análisis de datos de mercado abierto con el método de remuestreo Jackknife

Cyrill A. Murashev, 2023-02-08

## Abstracto

Los tasadores se enfrentan a menudo a la necesidad de analizar y describir datos de mercado recogidos en mercados abiertos. Casi siempre, no pueden obtener los datos de todo el mercado, sino que tratan con muestras que pueden ser muy pequeñas en comparación con toda la población. En este caso, surge el problema de las estimaciones sesgadas. De lo anterior se deduce que cualquier estimación estadística realizada a partir de la muestra en cuestión es una estimación para la propia muestra. Al mismo tiempo, puede tener un sesgo en relación con la estimación que se obtendría en el caso de un análisis de toda la población general. Los tasadores suelen decir que han calculado algunas estadísticas descriptivas del mercado. Puede tratarse de la media o mediana de precios, máximos y mínimos, asimetría y curtosis, etc. Pero debemos entender que sólo son estimaciones para muestras, no para todo el mercado. Hoy veremos las bases teóricas mínimas del método. Y luego lo aplicaremos a datos reales del mercado utilizando el lenguaje Python. Aprenderemos a determinar si existe sesgo para cualquier estimación y a reducir automáticamente su componente lineal. Este documento está disponible en [inglés](https://github.com/Kirill-Murashev/AI_for_valuers_book/blob/main/Parts-Chapters/Jackknife/jackknife.ipynb), [español](https://github.com/Kirill-Murashev/AI_for_valuers_book/blob/main/Parts-Chapters/Jackknife/jackknife-esp.ipynb), y [ruso](https://github.com/Kirill-Murashev/AI_for_valuers_book/blob/main/Parts-Chapters/Jackknife/jackknife-nov.ipynb). La versión inglesa es la más actual y la que se actualiza con mayor rapidez. Si hay discrepancias entre las versiones, debe confiarse en la versión inglesa.

## Fundamentos del método Jackknife

### Introducción

En primer lugar, debemos recordar por qué los tasadores necesitan estadísticas. Suelen tener una cierta distribución de las características de los objetos a partir de la muestra de análogos recogidos en el mercado abierto. Y tratan de obtener algunas estimaciones de los valores de estas características. Pueden ser la media, la mediana, el máximo, el mínimo, la varianza, etc. A veces también necesitan comparar dos o más submuestras para decidir si es necesario realizar algunos ajustes en función de la diferencia de los valores de las características. Como podemos adivinar, la mayoría de las veces los tasadores trabajan con muestras, no con todo el mercado. Por lo tanto, los tasadores solo pueden obtener estimaciones muestrales de los valores de las características, no sus valores reales. 
El método jackknife puede abordar dos cuestiones:
- reducir el sesgo de la estimación de la muestra en relación con el valor verdadero de la población general;
- calcular la varianza del valor del rasgo ajustado.

Supongamos que tenemos alguna característica *X* (podría ser el precio unitario, por ejemplo), cuya distribución en la población general desconocemos. Pero tenemos una muestra formada por n elementos $[x{1},\ldots, x_{n}]$. Queremos estimar la expectativa de *X*, que se puede escribir como $\mathbb{E}[X]$. En general, la expectativa puede escribirse del siguiente modo
$$\mathbb{E}[X] = \sum_{j=1}^{n >> 1} p(x_{j})x_{j}.$$

Pero sólo tenemos una muestra, que por supuesto consiste en un número muy limitado de observaciones, lejos del infinito. Por tanto, no podemos estimar la expectativa, sólo la media muestral, que se escribe como
$$\hat{\mu}=\dfrac{1}{n} \sum_{i=1}^{n<<\infty}x_{i}.$$

Por lo tanto, no utilizamos probabilidades, sino frecuencias observadas. Es obvio que $\mathbb{E}[X] \neq \hat{\mu}$, but $\hat{\mu} = \mathbb{E}[X] + \mathcal{bias}$, donde $\mu$ es la estimación de la expectativa, y el sesgo es algún desplazamiento sistemático entre los valores verdadero y estimado de la expectativa.

Obsérvese que el caso del cálculo de la media es el único en el que el método no puede calcular el sesgo, ya que él mismo se basa en el cálculo de la media. Esta es su principal limitación. Pero es bastante bueno para tratar con momentos centrales superiores a la media.

### Concepto general del método Jacknife

Hemos considerado un caso especial. Ahora podemos pasar al concepto más general de sesgo del estimador. Consideremos la variable aleatoria *X* con la distribución desconocida *U*. Hay un parámetro de su distribución llamado como $\theta$. Y queremos determinar su valor. El uso del parámetro abstracto $\theta$ en lugar de uno específico enfatiza la universalidad del método Jackknife, que es capaz de detectar sesgos para cualquier parámetro de la distribución y corregir automáticamente su componente lineal. También tenemos el parámetro $\hat{\theta}$, que es la estimación muestral obtenida mediante el empleo de alguna función. Debido al hecho de que $\hat{\theta}$ se obtuvo a partir de una muestra, mientras que queremos estimar $\theta$ para la población general, es decir, todo el mercado en el contexto de la valoración, $\hat{\theta}$ tiene un sesgo relativo a $\theta$. Matemáticamente, esto significa que la expectativa de $\hat{\theta}$ no es igual a la expectativa de $\theta$:
$$\mathbb{E}(\hat{\theta}) \neq \mathbb{E}(\theta).$$
En este caso, podemos decir que
$$\mathbb{E}(\hat{\theta}_{n}) = \theta + \frac{\alpha}{n} + \frac{\beta}{n^{2}} + \frac{\gamma}{n^{3}} + \ldots \frac{\omega}{n^{(k\rightarrow \infty)}},$$
donde $\theta$ es el valor verdadero del parámetro para la población general, y  $\frac{\alpha}{n} + \frac{\beta}{n^{2}} + \frac{\gamma}{n^{3}} + \ldots \frac{\omega}{n^{(k\rightarrow \infty)}}$ son componentes lineales, cuadráticos, cúbicos y otros del sesgo. Todos los componentes disminuyen a medida que crece la muestra según funciones lineales, cuadráticas, cúbicas y otras. El término lineal introduce el mayor error porque es el que disminuye más lentamente de todos los demás términos.

El método Jackknife elimina el componente lineal del sesgo. Introduzcamos algunas definiciones nuevas.

$\hat{\theta}_{i}$ es el valor de $\hat{\theta}$ que se obtendría si el cálculo no se basara en una muestra completa, sino en una muestra con una observación excluida *i* que toma valores de 1 a *n*. Entonces
$$\mathbb{E}(\hat{\theta}_{(i)}) = \theta + \frac{\alpha}{n-1} + \frac{\beta}{(n-1)^{2}} + \frac{\gamma}{(n-1)^{3}} + \ldots \frac{\omega}{(n-1)^{(k\rightarrow \infty)}}.$$
$\overline{\theta}$ es el valor medio de todos los $\hat{\theta}_{i}$.
$$\overline{\theta} = \frac{1}{n} \sum_{i=1}^{n} \hat{\theta}_{i}$$


### Resumen

Por lo tanto, para aplicar el método Jackknife, es decir, para detectar la presencia de un sesgo y eliminar automáticamente su componente lineal, es necesario seguir el siguiente conjunto de pasos.
1. Supongamos que necesitamos estimar algún parámetro $\theta$ de una variable aleatoria *X*.
1. Obtengamos alguna estimación de $\hat{\theta}$ para la muestra utilizando una función matemática $\hat{\theta}=F(x_{1},\ldots,x_{n})$.
1. $\hat{\theta}$ puede estar sesgada.
1. $\theta = \mathbb{E}(\hat{\theta}) + bias$.
1. Creemos las nuevas *n* muestras excluyendo secuencialmente una *x* de la muestra inicial.
1. Calcular el $\hat{\theta}_{(i)}$ para todas las nuevas muestras utilizando la misma función **F**.
1. Calcular la media de todos los $\hat{\theta}_{(i)}$ y etiquetarla como $\overline{\theta}$.
1. Calcular el sesgo mediante la siguiente fórmula
$$\widehat{bias}_{jack} = (n-1)(\overline{\theta} - \hat{\theta}).$$
1. Eliminar el componente lineal del sesgo mediante la fórmula
$$\hat{\theta}_{jacked} = \hat{\theta} - \widehat{bias}_{jack}.$$

## Aplicación práctica de Python

Hoy utilizaremos un conjunto de datos que contiene 34821 observaciones del mercado inmobiliario residencial de San Petersburgo. Se obtuvo a partir de web scraping en septiembre de 2021. Supongamos que este conjunto de datos contiene datos sobre todo el mercado, por lo que podemos usarlo como población general. A continuación, crearemos una submuestra con sólo 25 observaciones, que es el número típico de observaciones que maneja un tasador. Calcularemos algunas estimaciones para nuestra "población general" y, a continuación, calcularemos las estimaciones muestrales correspondientes. Por último, aplicaremos el método Jackknife y demostraremos que realmente puede reducir el sesgo.

In [194]:
# import libraries
import numpy as np
import pandas as pd
from astropy.stats import jackknife_resampling
from astropy.stats import jackknife_stats
from random import sample
from scipy.stats import skew
from scipy.stats import kurtosis

In [62]:
# import data
df = pd.read_csv("spba-flats-210928.csv", index_col=False)
print(df)

       Unnamed: 0                                     links  price_m  county
0               1  https://spb.cian.ru/sale/flat/262765174/   155460  sadadm
1               2  https://spb.cian.ru/sale/flat/263280601/   295455  sadadm
2               3  https://spb.cian.ru/sale/flat/261612519/   310559  sadadm
3               4  https://spb.cian.ru/sale/flat/263094016/   100000  sadadm
4               5  https://spb.cian.ru/sale/flat/262339898/   145929  sadadm
...           ...                                       ...      ...     ...
34816       34817  https://spb.cian.ru/sale/flat/256621764/    70093  llobol
34817       34818  https://spb.cian.ru/sale/flat/261430727/    67227  llobol
34818       34819  https://spb.cian.ru/sale/flat/246538655/    86207  llobol
34819       34820  https://spb.cian.ru/sale/flat/246587468/    65455  llobol
34820       34821  https://spb.cian.ru/sale/flat/239698989/    89041  llobol

[34821 rows x 4 columns]


In [193]:
# calculate statistics for the "general population"
gp_est    = df['price_m'].mean()
gp_sem    = df['price_m'].sem()
gp_min    = df['price_m'].min()
gp_25q    = df['price_m'].quantile(0.25)
gp_median = df['price_m'].median()
gp_75q    = df['price_m'].quantile(0.75)
gp_max    = df['price_m'].max()
gp_skew   = df['price_m'].skew()
gp_kurt   = df['price_m'].kurtosis()
gp_ran    = gp_max - gp_min

print("The estimation of unit price for population is", gp_est)
print("The standard error of unit price mean for population is", gp_sem)
print("The minimum of unit price for population is", gp_min)
print("The 0.25 quantile of unit price for population is", gp_25q)
print("The median of unit price for population is", gp_median)
print("The 0.75 quantile of unit price for population is", gp_75q)
print("The maximum of unit price for population is", gp_max)
print("The skewness of unit price for population is", gp_skew)
print("The kurtosis of unit price for population is", gp_kurt)
print("The range of unit price for population is", gp_ran)

The estimation of unit price for population is 176132.997530226
The standard error of unit price mean for population is 411.42108784161167
The minimum of unit price for population is 11817
The 0.25 quantile of unit price for population is 135870.0
The median of unit price for population is 162544.0
The 0.75 quantile of unit price for population is 196078.0
The maximum of unit price for population is 1624829
The skewness of unit price for population is 4.425121271105129
The kurtosis of unit price for population is 44.47491746881878
The range of unit price for population is 1613012


In [165]:
# create sample
sam_size = 25
ran_sam = df.sample(n=sam_size)
print(ran_sam)

       Unnamed: 0                                     links  price_m  county
3306         3307  https://spb.cian.ru/sale/flat/263952864/   208706  sfrn75
25446       25447  https://spb.cian.ru/sale/flat/264176271/   183721  swyswe
11568       11569  https://spb.cian.ru/sale/flat/262828919/   135742  skupes
33301       33302  https://spb.cian.ru/sale/flat/264080846/   106557  lwsswe
19647       19648  https://spb.cian.ru/sale/flat/259620581/   187500  sprn65
12156       12157  https://spb.cian.ru/sale/flat/263812187/   154135  smogag
33578       33579  https://spb.cian.ru/sale/flat/249136615/    94340  lkiotr
25289       25290  https://spb.cian.ru/sale/flat/262800893/   231783  swysam
18805       18806  https://spb.cian.ru/sale/flat/264405723/   182927  spechk
28863       28864  https://spb.cian.ru/sale/flat/261066046/   100000  lwsser
15471       15472  https://spb.cian.ru/sale/flat/264113874/   146245  snenar
24352       24353  https://spb.cian.ru/sale/flat/260113706/   154694  swyn15

In [166]:
# calculate statistics for the random sample
rs_mean   = ran_sam['price_m'].mean()
rs_sem    = ran_sam['price_m'].sem()
rs_min    = ran_sam['price_m'].min()
rs_25q    = ran_sam['price_m'].quantile(0.25)
rs_median = ran_sam['price_m'].median()
rs_75q    = ran_sam['price_m'].quantile(0.75)
rs_max    = ran_sam['price_m'].max()
rs_skew   = ran_sam['price_m'].skew()
rs_kurt   = ran_sam['price_m'].kurtosis()
rs_ran   = rs_max - rs_min

print("The mean of unit price for random sample is", rs_mean)
print("The standard error of unit price mean for random sample is", rs_sem)
print("The minimum of unit price for random sample is", rs_min)
print("The 0.25 quantile of unit price for random sample is", rs_25q)
print("The median of unit price for random sample is", rs_median)
print("The 0.75 quantile of unit price for random sample is", rs_75q)
print("The maximum of unit price for random sample is", rs_max)
print("The skewness of unit price for random sample is", rs_skew)
print("The kurtosis of unit price for random sample is", rs_kurt)
print("The range of unit price for random sample is", rs_ran)

The mean of unit price for random sample is 193665.44
The standard error of unit price mean for random sample is 20251.124762679232
The minimum of unit price for random sample is 63495
The 0.25 quantile of unit price for random sample is 146245.0
The median of unit price for random sample is 183333.0
The 0.75 quantile of unit price for random sample is 208706.0
The maximum of unit price for random sample is 574103
The skewness of unit price for random sample is 2.3536484943924028
The kurtosis of unit price for random sample is 7.829781802086403
The range of unit price for random sample is 510608


In [167]:
# obtain Jackknife resamples
new_df = ran_sam["price_m"]
array = new_df.to_numpy()
print(new_df)

3306     208706
25446    183721
11568    135742
33301    106557
19647    187500
12156    154135
33578     94340
25289    231783
18805    182927
28863    100000
15471    146245
24352    154694
12759    186667
18902    321429
802      193998
8789     112931
22581    183333
6809     152813
12278    212903
33868     63495
19219    273146
18680    574103
13881    193629
13526    318386
16092    168453
Name: price_m, dtype: int64


In [168]:
# obtain Jackknife resamples
resamples = jackknife_resampling(array)
print(resamples)

[[183721. 135742. 106557. 187500. 154135.  94340. 231783. 182927. 100000.
  146245. 154694. 186667. 321429. 193998. 112931. 183333. 152813. 212903.
   63495. 273146. 574103. 193629. 318386. 168453.]
 [208706. 135742. 106557. 187500. 154135.  94340. 231783. 182927. 100000.
  146245. 154694. 186667. 321429. 193998. 112931. 183333. 152813. 212903.
   63495. 273146. 574103. 193629. 318386. 168453.]
 [208706. 183721. 106557. 187500. 154135.  94340. 231783. 182927. 100000.
  146245. 154694. 186667. 321429. 193998. 112931. 183333. 152813. 212903.
   63495. 273146. 574103. 193629. 318386. 168453.]
 [208706. 183721. 135742. 187500. 154135.  94340. 231783. 182927. 100000.
  146245. 154694. 186667. 321429. 193998. 112931. 183333. 152813. 212903.
   63495. 273146. 574103. 193629. 318386. 168453.]
 [208706. 183721. 135742. 106557. 154135.  94340. 231783. 182927. 100000.
  146245. 154694. 186667. 321429. 193998. 112931. 183333. 152813. 212903.
   63495. 273146. 574103. 193629. 318386. 168453.]
 [208

In [169]:
# obtain Jackknife resamples shape
resamples.shape

(25, 24)

In [170]:
# obtain Jackknife estimate for the mean, its bias,
# its standard error, and its 95% confidence interval
test_statistic = np.mean

estimate, bias, stderr, conf_interval = jackknife_stats(
    array, test_statistic, 0.95)

mean_jacked = estimate
print("the jacked mean is", mean_jacked)
mean_true_bias =  rs_mean - gp_est
print("the true bias of the mean is", mean_true_bias)
mean_bias_jack = bias
print("the bias of the mean obtained by the Jackknife is", mean_bias_jack)
mean_corr_bias_perc = mean_bias_jack / mean_true_bias
print("the corrected percentage of the bias is", mean_corr_bias_perc)
mean_std_error = stderr
print("the standard error of the mean obtained by the Jackknife is", mean_std_error)
mean_conf_int = conf_interval
print("the confidence interval (95%) of the jacked mean is", mean_conf_int)

the jacked mean is 193665.4400000007
the true bias of the mean is 17532.44246977399
the bias of the mean obtained by the Jackknife is -6.984919309616089e-10
the corrected percentage of the bias is -3.983996708763267e-14
the standard error of the mean obtained by the Jackknife is 20251.12476267923
the confidence interval (95%) of the jacked mean is [153973.96481872 233356.91518128]


Como podemos ver, la expectativa es 176133, la media muestral es 193665, y la media ajustada obtenida por el método jackknife es también 193665. El intervalo de confianza para la media es [153974, 233357] con una probabilidad de 0.95. El intervalo de confianza calculado contiene el verdadero valor de la expectativa. Como ya hemos comentado, la media es el único parámetro de una distribución que, por su naturaleza, no puede ajustarse mediante el método Jackknife. Veamos ahora otros parámetros.


In [192]:
# obtain Jackknife estimate for the median, its bias,
# its standard error, and its 95% confidence interval
test_statistic = np.median

estimate, bias, stderr, conf_interval = jackknife_stats(
    array, test_statistic, 0.95)

median_jacked = estimate
print("the jacked median is", median_jacked)
median_true_bias =  rs_median - gp_est
print("the true bias of the median is", median_true_bias)
median_bias_jack = bias
print("the bias of the median obtained by the Jackknife is", median_bias_jack)
median_corr_bias_perc = median_bias_jack / median_true_bias
print("the corrected percentage of the bias is", median_corr_bias_perc)
median_std_error = stderr
print("the standard error of the median obtained by the Jackknife is", median_std_error)
median_conf_int = conf_interval
print("the confidence interval (95%) of the jacked median is", median_conf_int)

the jacked median is 183445.31999999983
the true bias of the median is 7200.002469773986
the bias of the median obtained by the Jackknife is -112.31999999983236
the corrected percentage of the bias is -0.015599994648801583
the standard error of the median obtained by the Jackknife is 952.8097934005506
the confidence interval (95%) of the jacked median is [181577.84712082 185312.79287918]


In [190]:
# obtain Jackknife estimate for the minimum, its bias,
# its standard error, and its 95% confidence interval
test_statistic = np.min

estimate, bias, stderr, conf_interval = jackknife_stats(
    array, test_statistic, 0.95)

min_jacked = estimate
print("the jacked min is", min_jacked)
min_true_bias =  rs_min - gp_min
print("the true bias of the mininimum is", min_true_bias)
min_bias_jack = bias
print("the bias of the minimum obtained by the Jackknife is", min_bias_jack)
min_corr_bias_perc = min_bias_jack / min_true_bias
print("the corrected percentage of the bias is", min_corr_bias_perc)
min_std_error = stderr
print("the standard error of the mininimum obtained by the Jackknife is", min_std_error)
min_conf_int = conf_interval
print("the confidence interval (95%) of the jacked minimum is", min_conf_int)

the jacked min is 33883.79999999993
the true bias of the mininimum is 51678
the bias of the minimum obtained by the Jackknife is 29611.20000000007
the corrected percentage of the bias is 0.5729943109253468
the standard error of the mininimum obtained by the Jackknife is 29611.2
the confidence interval (95%) of the jacked minimum is [-24153.08553901  91920.68553901]


In [174]:
# obtain Jackknife estimate for the maximum, its bias,
# its standard error, and its 95% confidence interval
test_statistic = np.max

estimate, bias, stderr, conf_interval = jackknife_stats(
    array, test_statistic, 0.95)

maximum_jacked = estimate
print("the jacked maximum is", maximum_jacked)
maximum_true_bias =  rs_max - gp_max
print("the true bias of the maximum is", maximum_true_bias)
maximum_bias_jack = bias
print("the bias of the maximum obtained by the Jackknife is", maximum_bias_jack)
maximum_corr_bias_perc = maximum_bias_jack / maximum_true_bias
print("the corrected percentage of the bias is", maximum_corr_bias_perc)
maximum_std_error = stderr
print("the standard error of the maximum obtained by the Jackknife is", maximum_std_error)
maximum_conf_int = conf_interval
print("the confidence interval (95%) of the jacked maximum is", maximum_conf_int)

the jacked maximum is 816670.0399999991
the true bias of the maximum is -1050726
the bias of the maximum obtained by the Jackknife is -242567.0399999991
the corrected percentage of the bias is 0.23085660771694913
the standard error of the maximum obtained by the Jackknife is 242567.04
the confidence interval (95%) of the jacked maximum is [ 341247.37776351 1292092.70223649]


In [195]:
# obtain Jackknife estimate for the skewness, its bias,
# its standard error, and its 95% confidence interval
test_statistic = skew

estimate, bias, stderr, conf_interval = jackknife_stats(
    array, test_statistic, 0.95)

skew_jacked = estimate
print("the jacked skewness is", skew_jacked)
skew_true_bias =  rs_skew - gp_skew
print("the true bias of the skewness is", skew_true_bias)
skew_bias_jack = bias
print("the bias of the skewness obtained by the Jackknife is", skew_bias_jack)
skew_corr_bias_perc = skew_bias_jack / skew_true_bias
print("the corrected percentage of the bias is", skew_corr_bias_perc)
skew_std_error = stderr
print("the standard error of the skewness obtained by the Jackknife is", skew_std_error)
skew_conf_int = conf_interval
print("the confidence interval (95%) of the jacked skewnes is", skew_conf_int)

the jacked skewness is 3.7874875564237587
the true bias of the skewness is -2.0714727767127266
the bias of the skewness obtained by the Jackknife is -1.5774797157901084
the corrected percentage of the bias is 0.7615256804356616
the standard error of the skewness obtained by the Jackknife is 1.6269608977678238
the confidence interval (95%) of the jacked skewnes is [0.59870279 6.97627232]


In [191]:
# obtain Jackknife estimate for the kurtosis, its bias,
# its standard error, and its 95% confidence interval
test_statistic = kurtosis

estimate, bias, stderr, conf_interval = jackknife_stats(
    array, test_statistic, 0.95)

kurt_jacked = estimate
print("the jacked kurtosis is", kurt_jacked)
kurt_true_bias =  rs_kurt - gp_kurt
print("the true bias of the kurtosis is", kurt_true_bias)
kurt_bias_jack = bias
print("the bias of the kurtosis obtained by the Jackknife is", kurt_bias_jack)
kurt_corr_bias_perc = kurt_bias_jack / kurt_true_bias
print("the corrected percentage of the bias is", kurt_corr_bias_perc)
kurt_std_error = stderr
print("the standard error of the kurtosis obtained by the Jackknife is", kurt_std_error)
kurt_conf_int = conf_interval
print("the confidence interval (95%) of the jacked kurtosis is", kurt_conf_int)

the jacked kurtosis is 14.227526609758394
the true bias of the kurtosis is -36.64513566673238
the bias of the kurtosis obtained by the Jackknife is -8.109145853579356
the corrected percentage of the bias is 0.22128846587791726
the standard error of the kurtosis obtained by the Jackknife is 6.04963781033231
the confidence interval (95%) of the jacked kurtosis is [ 2.37045438 26.08459884]


### Results

Los resultados de la aplicación del método Jackknife se resumen en la tabla siguiente.

|Estimate |True value | Sample estimate | Jacked estimate | True bias | Corrected bias | Corr. perc. of the bias | Confidence Interval| CI Corr.|
| :- | :- | :- | :- | :- | :- | :- | :- | :- |
|Mean|176132|193665|193665|17532|0|0|153974, 233357|yes|
|Minimum|11817|63495|33884|51678|29611|0.573|-24153, 91921|yes|
|Maximum|1624829|574103|816670|-1050726|-242567|0.23|341247, 1292093|no|
|Skewness|4.425|2.35|3.787|-2.071|-1.577|0.762|0.599, 6.976|yes|
|Kurtosis|44.475|7.830|14.228|-36.645|-8.109|0.221|2.370, 26.085|no|
|Median|162544|183333|183445|7200|-112|-0.016|181578, 185313|no|

Los problemas de utilizar el método Jackknife para el ajuste de la media ya se comentaron anteriormente. Como podemos ver en la tabla, este método tampoco es bueno para el ajuste de la mediana. Sin embargo, es útil para ajustar momentos centrales superiores a la media, así como para ajustar valores marginales.

## Epílogo

El método Jackknife es una herramienta sencilla y eficiente desde el punto de vista computacional para ajustar algunos estimadores de muestreo. No es el Santo Grial, pero puede resolver algunos de los problemas de estimación de los parámetros de un mercado abierto. Espero que su aplicación ayude a muchos tasadores en su práctica diaria. Y tal vez inspire a alguien a utilizar más ampliamente los métodos de aprendizaje automático en las actividades de valoración. El próximo tema será un método más potente y universal de bootstrapping. Consulte las actualizaciones.