# Teoremas Asintóticos

## Leyes de los grandes números

**Las leyes de los grandes números** dicen que la media de una muestra grande está cerca de la media de la distribución de la población. Estas leyes son importantes porque garantizan resultados estables a largo plazo para las medias de algunos eventos aleatorios. 

Aquí veamos la **ley débil de los grandes números** primero. 

Sean $X_1,...X_n$ v.a. independientes idénticamente distribuidas (i.i.d.) de media $\mu$. Entonces, $\overline{X}_n=\frac{1}{n}\sum_{i=1}^n X_i$ cumple:

$$\lim_{n \to \infty} P\left\{\middle | \overline{X}_n - \mu \,\middle | < \epsilon \right\} = 1$$

para cualquier $\epsilon >0$.

¿Cómo se entiende esto? 

```{toggle}
Usualmente se escribe como 

$$\begin{array}{c} 
\overline{X}_n \overset{p}{\to} \mu \\
(\overline{X}_n \text{ converge en probabilidad a X cuando } n \to \infty)
\end{array}$$

Es decir, la distribución de la media muestral $\overline{X}_n$ se concentra más alrededor de la verdadera media $\mu$ a medida que $n$ se hace grande.
```

Ahora, ¿puedes aplicar esta ley para explicar por qué podemos obtener la probabilidad utilizando la frecuencia? 
- Sea $n$ el número de experimentos, y $n(A)$ el número de veces que el evento $A$ ocurre en la realización de esos experimentos, entonces $P(A) = \frac{n(A)}{n}$

(Pista: en la ley arriba, cada $X_i$ puede verse como una variable Bernoulli que indica si el evento $A$ occure o no). 

En concreto, la explicación corresponde a la [ley fuerte de Borel de los grandes números](https://en.wikipedia.org/wiki/Law_of_large_numbers#Borel's_law_of_large_numbers) que es un caso especial de las leyes más generales de los grandes números. 

Formalmente, si n(A) es el número de éxitos en los n experimentos Bernoulli repetidos independientes con la probabilidad de exito p, entonces, 

$$ P(\lim_{n \to \infty} \frac{n(A)}{n} = p) = 1$$

Usualmente se escribe como: 
$$\begin{array}{c} 
\frac{n(A)}{n} \overset{c.s.} {\to} p \\
(\frac{n(A)}{n} \text{ converge casi seguramente, o con probabilidad 1 a p cuando } n \to \infty)
\end{array}$$

Esta ley vincula el concepto abstracto de probabilidad con la frecuencia, i.e., la proporción de veces que se espera que ocurra un evento (A) determinado es aproximadamente igual a la probabilidad de que ocurra en un ensayo concreto (o la probabilidad real/poblacional). 

## Teorema del Límite Central
La ley de los grandes números dice que la distribución de $\overline{X}_n$ se acumula cerca de $\mu$. Pero esto no es suficiente para ayudarnos a aproximar la distribución de probabilidad sobre $\overline{X}_n$. Para ello necesitamos el teorema del límite central.

**El teorema del límite central** dice que la media muestral tiene aproximadamente una distribución Normal para una muestra grande. 

Sean $X_1,...X_n$ v.a. i.i.d. de media $\mu$ y varianza $\sigma^2$, entonces $\overline{X}_n=\frac{1}{n}\sum_{i=1}^n X_i$ cumple:

$$ \lim_{n \to \infty}P\left( \frac{\overline{X}_n - \mu}{\sqrt{\frac{\sigma^2}{n}}} \leq z\right) = \Phi(z)  \qquad Z \sim \cal{N}(0,1)$$

¿Cómo se entiende esto? 

```{toggle}
Usualmente se escribe como 

$$\begin{array}{c} 
\frac{\overline{X}_n - \mu}{\sqrt{\frac{\sigma^2}{n}}}\overset{d}{\to} Z \\ \\
(\frac{\overline{X}_n - \mu}{\sqrt{\frac{\sigma^2}{n}}} \text{ converge en distribución a Z cuando } n \to \infty)
\end{array}$$

o 

$$\begin{array}{c} 
\overline{X}_n \overset{d}{\to} \cal{N}(\mu,\frac{\sigma^2}{n})
\end{array}$$

Es decir que es posible aproximar la distribución de $\overline{X}_n$ por ${\cal{N}}(\mu,\frac{\sigma^2}{n})$ que tiene la misma media y $\frac{1}{n}$ de la varianza de la distribución de población.</span>
```

Esta simulación puede ayudar a entenderlo: [Simulation](https://onlinestatbook.com/stat_sim/sampling_dist/)
- Ojo: hay un error en esta simulación, puedes identificalo? 
- Esta [video](https://onlinestatbook.com/2/sampling_distributions/clt_demo.html#video) (en la derecha de la página) demostra una simulación más correcta. 

:::{note}
- En este teorema, $X_i$ no tiene que tener una distribución normal; podría ser cualquier distribución.
- El teorema del límite central es sobre la media muestral, no sobre la variable aleatoria en sí misma.
:::

Una aplicación muy importante de este teorema consiste en determinar valores razonables de la media de la población $\mu$. Temas como prueba de hipótesis, estimación, y muchos otros utilizan este teorema. Vamos a repasar este teorema en alguna clase en el futuro.