# Machete: Teorema Central del Límite

Sea $X$ v.a. con media $\mu$ y desvío estándar $\sigma$.

Recordar que si el enunciado nos dá $V(X)$ entonces despejamos $\sigma = \sqrt{V(X)}$.

Sea $X_1, \dots, X_n$ una muestra aleatoria. Suponemos que todas las $X_i$ son v.a.i.i.d.

## Versión suma

Sea $S_n = \sum_{i=1}^n X_i$ la suma de todas las muestras de $X$.

$E(S_n) = E(\sum_{i=1}^n X_i) = \sum_{i=1}^n E(X_i) = n E(X_i) = n \mu$

$V(S_n) = V(\sum_{i=1}^n X_i) = \sum_{i=1}^n V(X_i) = n V(X_i)$

Por TCL:

$
\begin{align*}
\frac{Sn - E(S_n)}{\sqrt{V(S_n)}} \xrightarrow{d} Z \sim N(0,1)
\end{align*}
$

$P(Sn < x) \approx P\Big(Z < \tfrac{x - E(S_n)}{\sqrt{V(S_n)}}\Big) = P\Big(Z < \tfrac{x - n \mu}{\sqrt{nV(X_i)}}\Big) = P\Big(Z < \tfrac{x - n \mu}{\sigma \sqrt{n}}\Big)$

### Funciones útiles

In [1]:
tcl.sum = function(x, n, u, sd, lower.tail=TRUE) pnorm((x - n * u) / (sd * sqrt(n)), lower.tail=lower.tail)

In [2]:
tcl.sum.findn = function(x, q, u, sd, n.lower.tail=TRUE, z.lower.tail=TRUE) {
    # x: cota de la v.a. original antes del TCL
    # q: probabilidad de la normal estándar para la cual vamos a buscarle el percentil
    # u: E(X)
    # sd: √V(X)
    # Ejemplos de cómo configurar n.lower.tail / z.lower.tail:
    # P(Sn < x) < q    tcl.sum.findn(x, q, u, sd, n.lower.tail=TRUE, z.lower.tail=TRUE)
    # P(Sn < x) > q    tcl.sum.findn(x, q, u, sd, n.lower.tail=TRUE, z.lower.tail=FALSE)
    # P(Sn > x) < q    tcl.sum.findn(x, q, u, sd, n.lower.tail=FALSE, z.lower.tail=TRUE)
    # P(Sn > x) > q    tcl.sum.findn(x, q, u, sd, n.lower.tail=FALSE, z.lower.tail=FALSE)
    z = qnorm(q, lower.tail=z.lower.tail)
    a = u^2
    b = -(2 * u * x + z^2 * sd^2)
    c = x^2
    discriminante = b^2 - 4 * a * c
    n1 = (-b + sqrt(discriminante)) / (2 * a)
    n2 = (-b - sqrt(discriminante)) / (2 * a)
    return(if (n.lower.tail) floor(min(c(n1, n2))) else ceiling(max(c(n1, n2))))
}

## Versión promedio

Sea $\bar{X} = \sum_{i=1}^{n} \tfrac{E(X_i)}{n}$ el promedio de todas las muestras de $X$.

$E(\bar{X}) = E(\sum_{i=1}^{n} \tfrac{E(X_i)}{n}) = \tfrac{1}{n} \sum_{i=1}^{n} E(X_i) = \tfrac{1}{n} n E(X_i) = E(X_i) = \mu$

$V(\bar{X}) = V(\sum_{i=1}^{n} \tfrac{V(X_i)}{n}) = \tfrac{1}{n^2} \sum_{i=1}^{n} V(X_i) = \tfrac{1}{n^2} n V(X_i) = \tfrac{V(X_1)}{n}$

Por TCL:

$
\begin{align*}
\frac{\bar{X} - E(\bar{X})}{\sqrt{V(\bar{X})}} \xrightarrow{d} Z \sim N(0,1)
\end{align*}
$

$P(\bar{X} < x) \approx P\Big(Z < \tfrac{x - E(\bar{X})}{\sqrt{V(\bar{X})}}\Big) = P\Big(Z < \tfrac{x - \mu}{\sqrt{\tfrac{V(X_1)}{n}}}\Big) = P\Big(Z < \tfrac{\sqrt{n}(x - \mu)}{\sigma}\Big)$

### Funciones útiles

In [3]:
tcl.avg = function(x, n, u, sd, lower.tail=TRUE) pnorm((sqrt(n) * (x - u)) / sd, lower.tail=lower.tail)

In [5]:
tcl.avg.findn = function(x, q, u, sd, n.lower.tail=TRUE, z.lower.tail=TRUE) {
    # x: cota de la v.a. original antes del TCL
    # q: probabilidad de la normal estándar para la cual vamos a buscarle el percentil
    # u: E(X)
    # sd: √V(X)
    # Ejemplos de cómo configurar n.lower.tail / z.lower.tail:
    # P(Sn < x) < q    tcl.avg.findn(x, q, u, sd, n.lower.tail=TRUE, z.lower.tail=TRUE)
    # P(Sn < x) > q    tcl.avg.findn(x, q, u, sd, n.lower.tail=TRUE, z.lower.tail=FALSE)
    # P(Sn > x) < q    tcl.avg.findn(x, q, u, sd, n.lower.tail=FALSE, z.lower.tail=TRUE)
    # P(Sn > x) > q    tcl.avg.findn(x, q, u, sd, n.lower.tail=FALSE, z.lower.tail=FALSE)
    z = qnorm(q, lower.tail=z.lower.tail)
    n = ((z * sd) / (x - u))^2
    return(if (n.lower.tail) floor(n) else ceiling(n))
}