## Desviacion estandar de la media (error estandar)

In [None]:
import numpy as np
import matplotlib.pyplot as plt 
%matplotlib inline

Vamos a considerar un experimento consistente en medir $N$ veces una cantidad y reportar el mejor estimado como su promedio, y su dispersion como la desviacion estandar.

Ahora repetimos ese experimento muchas ($M$) veces, y nos preguntamos **qué distribucion tendran esos $M$ promedios?**

In [None]:
# numero de mediciones en 1 experimento
N = 100 # probemos con 1000 también

# numero de veces que realizamos ese experimento consistente en medir N veces
M = 10000

Simulo una sola experiencia

In [None]:
# tomo un solo set de N mediciones y calculo la std
x_1muestra = np.random.randn(N)
sigma_x = np.std(x_1muestra)

Hago la experiencia simulada:

In [None]:
# Creo un lugar (una variable) con espacio para guardar los M promedios que voy
# a calcular al repetir la experiencia
Xmedias = np.empty(M)

In [None]:
# Repito para los M experimentos
# consistentes (cada uno) en medir N veces una cantidad
for i in range(M):

  # hago N mediciones
  datos_1_experimento = np.random.randn(N)

  # calculo la media de este conjunto de N mediciones
  media_1_experimento = np.mean(datos_1_experimento)

  # guardo el valor de esa media para este experimento
  Xmedias[i] = media_1_experimento

Ahora calculo la desviacion estandar de la media (también llamado error estandar):

$$
\sigma_\overline{x} = \frac{\sigma_x}{\sqrt{N}}
$$

In [None]:
sigma_xmedia = sigma_x/np.sqrt(N)

Una vez calculado todo, grafico lo obtenido mediante histogramas, con la opcion `density=True` para imponer la normalizacion de nuestro histograma.

In [None]:
# Grafico los resultados
plt.figure()

# el histograma de las X medias
plt.hist(Xmedias, bins=100, density=True, label='distribucion de promedios');

# agrego etiquetas a los ejes y el grid
plt.xlabel(r'$x$ [u.a.]')
plt.ylabel(r'$p(x)$')
plt.legend()
plt.grid(True)

In [None]:
# Grafico los resultados
plt.figure()

# el histograma de las X medias
plt.hist(Xmedias, bins=100, density=True, label="distribucion de promedios", alpha=0.5);

# el histograma de 1 sola muestra
plt.hist(x_1muestra, bins=15, density=True, label="1 medicion", alpha=0.5);

# agrego etiquetas a los ejes y el grid
plt.xlabel(r'$x$ [u.a.]')
plt.ylabel(r'$p(x)$')
plt.legend()
plt.grid(True)

In [None]:
# Grafico los resultados
plt.figure()

# el histograma de las X medias
plt.hist(Xmedias, bins=200, density=True, label="distribucion de promedios");

# el plot de la distribucion gaussiana con sigma_x
x = np.linspace(-3, 3, 1000)
plt.plot(x, 1/np.sqrt(2*np.pi)/sigma_x*np.exp(-(x)**2/2/sigma_x**2), 'r', 
         label='gaussiana c/sigma_x')

# el plot de una distribucion gaussiana con sigma_xmedia
plt.plot(x, 1/np.sqrt(2*np.pi)/sigma_xmedia*np.exp(-(x)**2/2/sigma_xmedia**2), 'k', 
         label='gaussiana c/sigma_x_media')

# agrego etiquetas a los ejes y el grid
plt.xlabel(r'$x$ [u.a.]')
plt.ylabel(r'$p(x)$')
plt.gca().legend(loc='center left', bbox_to_anchor=(1, 0.5))
plt.grid(True)

In [None]:
# Grafico los resultados
plt.figure()

# el histograma de las X medias
plt.hist(Xmedias, bins=200, density=True, label="distribucion de promedios");

# el plot de la distribucion gaussiana con sigma_x
x = np.linspace(-3, 3, 1000)
plt.plot(x, 1/np.sqrt(2*np.pi)/sigma_x*np.exp(-(x)**2/2/sigma_x**2), 'r', 
         label='gaussiana c/sigma_x')

# el plot de una distribucion gaussiana con sigma_xmedia
plt.plot(x, 1/np.sqrt(2*np.pi)/sigma_xmedia*np.exp(-(x)**2/2/sigma_xmedia**2), 'k', 
         label='gaussiana c/sigma_x_media')

# el histograma de 1 sola muestra
plt.hist(x_1muestra, bins=15, density=True, label="1 medicion", alpha=0.5);

# agrego etiquetas a los ejes y el grid
plt.xlabel(r'$x$ [u.a.]')
plt.ylabel(r'$p(x)$')
plt.gca().legend(loc='center left', bbox_to_anchor=(1, 0.5))
plt.grid(True)