# Sesgo de las varianzas muestrales

Mostramos que la varianza muestral sin la corrección de Bessel ($S_n^2$) es un estimador sesgado de la varianza. Por otro lado, la versión corregida de la varianza muestral $S^2$, no tiene sesgo dentro de las incertezas numéricas.

Simulo muestras de de variables normales mucha veces

In [None]:
import math
variance = 1
sigma = math.sqrt(variance)
# Sample size
nvariables = 3
# Number of simulated samples
nsimulations = 100000

In [None]:
from scipy.stats import norm
import numpy as np
rng = np.random.default_rng(seed=6870)
data = norm.rvs(scale=sigma, size=(nsimulations, nvariables))
data[0:5]

## Estadístico $S_n^2$

Calculo la varianza muestral **sin** la corrección de Bessel: 

In [None]:
variance_1 = data.var(ddof=0, axis=1)

Media de la varianza muestral

In [None]:
variance_1_mean = variance_1.mean()
variance_1_mean

Sesgo de la varianza muestral

In [None]:
bias_1 = variance_1_mean - variance
bias_1

El estadístico $S_n^2$ es un estimador *sesgado* de la varianza.

## Estadístico $S^2$

Calculo la varianza muestral **con** la corrección de Bessel: 

In [None]:
variance_2 = data.var(ddof=1, axis=1)

Media de la varianza muestral

In [None]:
variance_2_mean = variance_2.mean()
variance_2_mean

Sesgo de la varianza muestral

In [None]:
bias_2 = variance_2_mean - variance
bias_2

El estadístico $S^2$ es un estimador *sin sesgo* de la varianza. Al menos lo vimos dentro de las incertezas numéricas por el número finito de simulaciones.