## Estimador vs. tamaño de una muestra

Consideramos una muestra de datos medidos en un experimento. Modelamos cada resultado como una variable alearoria $X$ que sigue una distribución normal con media μ desconocida y desviación estándar σ conocida, $X_i \sim N(\mu,\sigma)$. Representamos una muestra con el vector aleatorio, $X = (X_1, X_1, \cdots, X_n)$, dónde n es el tamaño de la muestra. 

Desviación estándar

In [None]:
sigma = 1.8

## Muestra 1

Consideramos primero una muestra de cinco datos:

In [None]:
import numpy as np
x1 = np.array([27.37, 26.79, 27.84, 25.03, 27.85])

In [None]:
sample_size1 = len(x1)
sample_size1

El estimador de la media μ es, $\bar{X}_1 = \sum_{i=1}^5 X_i$:

In [None]:
mu_est_1 = np.mean(x1)
print(f"{mu_est_1:2.2f}")

La desviación estándar de la media muestral es:

In [None]:
import math
sigma_sample_mean_1 = sigma / math.sqrt(sample_size1)
print(f"{sigma_sample_mean_1:2.2f}")

## Muestra 2

Tomamos otros cinco nuevos datos con nuestro experimento:

In [None]:
x2 = np.array([23.89, 24.33, 26.44, 24.61, 27.45])

Combinamos los diez datos en una sola muestra para aprovechar toda la información disponible:

In [None]:
x = np.concatenate([x1,x2])
x

In [None]:
sample_size2 = len(x)
sample_size2

Calculamos el estimador de μ con todos los datos, $\bar{X}_2 = \sum_{i=1}^{10} X_i$::

In [None]:
mu_est_2 = np.mean(x)
print(f'{mu_est_2:2.2f}')

El estimador de μ cambia cuando tomamos más datos.

Calculamos la desviación estándar del estimador de μ

In [None]:
sigma_mean = sigma / math.sqrt(sample_size2)
print(f'{sigma_mean:2.2f}')

Debido a que el tamaño de la muestra 2 es mayor al de la muestra 1, las fluctuaciones de la media muestral $\bar{X}_2$ son menores a las de $\bar{X}_1$. 

Recordemos que, dado que $X$ es una variable normal, la media muestral es un estimador sin sesgo de la media μ. Por lo tanto, las medias muestrales fluctúan alrededor de la media μ. Entonces, la variable aleatoria $\bar{X}_2$ fluctúa menos *alrededor de μ* que $\bar{X}_1$. Sin embargo para un experimento en particular, como el que estamos mostrando, desconocemos cuáles de las dos medias muestrales están más cerca de la media μ. Por ejemplo puede haber pasado que por azar el evento $\bar{X}_1 = \bar{x}_1$ sea más cercano a μ que el evento $\bar{X}_2 = \bar{x}_2$. 