## **Intervalos de Confianza**
La estimación por intervalos o intervalos de confianza se refiere a que en vez de pensar en un estimador puntual para el parámetro, nuestro resultado nos generará un intervalo de donde teóricamente podemos decir contiene el valor del parámetro. A futuro, podriamos comparar el intervalo con las estimaciones de nuestro estimador y ver que a medida que se repita la estimación los valores que arroja en consecuencia se encuentran dentro del intervalo a estudiar.

### Motivación de la estimación por intervalo

- Vimos que la estimación puntual es un proceso que puede dar resultados muy alejados del parámetro de interés.
    - La única manera de mejorar la estimación puntual es aumentar el tamaño de muestra, pero eso no siempre es posible.

- Sea $\hat{\theta}$ el UMVUE del parámetro $\theta$, si $\hat{\theta}$ es una variable aleatoria continua $p(\hat{\theta}=\theta) = \int_{\theta}^{\theta} f_{\hat{\theta}}(x) dx = 0$

- ¿Cómo podemos incorporar la variablilidad del proceso de estimación de modo que, en vez de dar un único valor para un parámetro, demos un intervalo en el cual puede estar el verdadero valor del parámetro? ¿Qué elementos tendrían ustedes en cuenta para construir, por ejemplo, un intervalo para la media?

    - Varianza del estimador/MSE (datos)
     
    - Tamaño de la muestra
    
    - Una estimación puntual (con los datos observados calculamos una estimación del parámetro)
    
    - Confianza (quiero un intervalo que sea valido en la mayoria de los casos, sin llegar a superar un presupuesto como el de la colecta de datos)
    
    - La región de confianza (forma de elipse), se ve en inferencia multivariada.

<a id='DefiniciosVariablePivote'></a>
### **Variable pivote**
Una variable aleatoria $Q(\mathbf{X},\theta)$ es una **variable pivote** si:

- $Q(\mathbf{X})$ es una función monótona en su segundo argumento (la v.a. pivote crece o decrece a medida que los valores de $\theta$ crece o decrece, o lo análogamente contrario).

- Su expresión depende del parámetro desconocido $\theta$,

- PERO, su distribución (asintótica) no depende del parámetro desconocido alguno.

> Las variables aleatorias pivotes del parámetro $\theta$ no son [estadísticas](NotasDeClase2_DistribucionesMuestrales.ipynb/#DefinicionEstadistica), de hecho son lo contrario.

¿Existe alguna relación entre la definición de variable pivote y estadística? ¿Son equivalente o alguna implica la otra?

#### Ejemplo Sea $X_1, X_2, \cdots, X_n$ una muestra aleatoria $N(\mu, \sigma^2)$

1. Si $\sigma^2$ es conocida, ¿cuál sería una variable aleatoria pivote para $\mu$?
    - $\bar{X}_n - \mu \sim N(0,\frac{\sigma^2}{n})$
    - $\sqrt{n}(\bar{X}_n - \mu) \sim N(0,\sigma^2)$
> Notemos que son funciónes monótonas respecto al crecimiento o decrecimiento de $\mu$.

2. Si $\sigma^2$ es desconocido, ¿cuál sería una variable aleatoria pivote para $\mu$?
    - $\frac{\sqrt{n}(\bar{X}_n - \mu)}{\sigma} \sim N(0,1)$    
> A pesar de que la espresión cumple con la definición de variable pivote, en la práctiva no nos va a ser muy útil dado que a la larga esperamos despejar $\mu$ y esta va a estar en función de $\sigma^2$ a la final.
    - $\frac{\sqrt{n}(\bar{X}_n - \mu)}{S_n} \sim t(n-1)$ (Gosset)

3. Si $\mu$ es desconocido, ¿cuál sería una variable aleatoria pivote para $\sigma^2$?
    - $\frac{(n-1)S_n^2}{\sigma^2} \sim \chi^2(n-1)$
> Dado que en función de $\sigma^2$ la función anterior es una hipérbole tenemos que es monótona en el diminio de $\sigma^2$

### **Intervalo aleatorio**
Un intervalo aleatorio corresponde a un par de variables aleatorias, $L(\mathbf{X})$ y $U(\mathbf{X})$, tal que 

$$
p(L(\mathbf{X}) \leq U(\mathbf{X})) = 1 
$$

### **Estimador por intervalo**
El intervalo aleatorio $[L(\mathbf{X}),U(\mathbf{X})]$ es un estimador por intervalo, para el parámetro $\theta$ con una probabilidad $1-\alpha$ con $\alpha \in (0,1)$, si:

$$
p(\theta \in [L(\mathbf{X}),U(\mathbf{X})]) = 1 - \alpha
$$

- Se dice que la probabilidad de que el intervalo contenga al parámetro es $1-\alpha$, dado que $L$ y $U$ son variables aleatorias (son el elemento aleatorio).

> Podemos ver que en la definición de estimador por intervalo $\theta$ no es aleatorio, lo único aleatorio es el intervalo. De este modo tenemos en palabras que, el estimador por intervalo es la probabilidad de que el intervalo contenga al valor del parámetro.

- Es decir, para cada muestra que yo tome, voy a obtener un intervalo diferente (que puede o no contener al verdadero parámetro), **PERO**, en $100(1-\alpha)$% de las muestras estará el verdadero parámetro.

- Cuando tenemos datos y calculamos una **estimación por intervalo** para esos datos, ya no podemos hablar de la probabilidad; debemos hablar de **confianza**. Es decir, otra vez nos toca "cruzar los dedos" y pedir que nos resulte un buen intervalo a partir del muestreo desarrollado (que usualmente es el único posible de realizar).

![](https://cdn.mathpix.com/snip/images/IlDdLo9Okcz0wWinnlGyqdmFzYj9wvETg7CPpzWoVmQ.original.fullsize.png)

> En la práctica, en la mayoría de las ocasiones solamente podemos generar una vez el intervalo. De este modo es mejor hablar de confianza sobre el intervalo.

- Cuando tengamos datos recogidos entonces nos encontraremos que $[l(\mathbf{X}),u(\mathbf{X})]$ es un intervalo de confianza con $l(\mathbf{X}) \leq u(\mathbf{X})$, con una confianza del $100(1-\alpha)$% de esperar que $\theta$ esté dentro de $[l(\mathbf{X}),u(\mathbf{X})]$.

> Es importante tener en cuenta que la siguiente probabilidad $p(\theta \in [l(\mathbf{X}),u(\mathbf{X})])$ es siempre igual a $1$ o $0$ dado que no tenemos nada aleatorio entre la probabilidad, para el caso nos estan preguntando algo como $p(1 \in [0,2])$ o algo como $p(1 \in [2,3])$.

### **Método de la variable pivote:**

1. Encuentre una variable pivote $Q(\mathbf{X},\theta)$ para el parámetro de interés. (nada fácil)
2. Encuentre números reales, $a$ y $b$ tales que $p(a \leq Q(\mathbf{X}) \leq b) = 1 -\alpha$
> Tenemos que tener en cuenta que los valores de $a$ y $b$ y la igualdad son independientes del valor de $\theta$.
3. Aplique operaciones válidas de desigualdades hasta obtener $p(L(\mathbf{X}, a, b) \leq \theta \leq U(\mathbf{X}, a, b))=1-\alpha$ (para este despeje era necesaria la independencia de $a$ y $b$)
4. Una vez se tengan los datos, $\mathbf{x}$, un intervalo del $100(1-\alpha)$% de confianza para $\theta$ es $I C_{100(1-\alpha) \%}(\theta)=[l(\mathbf{x}, a, b), u(\mathbf{x}, a, b)]$

A este punto debemos pensar que ¿cómo encuentro una variable pivote? y ¿cuantas soluciones para $a$ y $b$ hay en el paso $2$?
La respuesta a la primera pregunta se verá más adelante, pero para la segunda veamos que 

![](https://cdn.mathpix.com/snip/images/CDQna4iZsSyBqwH-4cjw2kRb-kCvyEVEki5f5tzhC38.original.fullsize.png)

![](https://cdn.mathpix.com/snip/images/ACBBIjPcHXsrSbKGkeNdGpjSUX93sAaG82hNwzvKwIQ.original.fullsize.png)

![](https://cdn.mathpix.com/snip/images/ACBBIjPcHXsrSbKGkeNdGpjSUX93sAaG82hNwzvKwIQ.original.fullsize.png)



### **Definición: Intervalo de longitud mínima**
Para obtener un intervalo de longitud mínima, debe resolverse el problema de optimización restringida $\operatorname{min}\{b-a\}$ s.a. (sujeto a la restricción) $p( a \leq Q(\mathbf{X}) \leq b) = 1 - \alpha$

> Este problema se resuelve desde los multiplicadores de lagrange.

<a id='TeoremaLongitudMinima'></a>
### **Teorema**
Sea $f_Q(q)$ una densidad unimodal (solo tiene un pico). Si el intervalo $[a,b]$ satisface que
1. $\int_a^b f_Q(q) dq = 1-\alpha$  ( $p( a \leq Q(\mathbf{X}) \leq b) = 1 - \alpha$ )
2. $f_Q(a)=f_Q(b)>0$
3. $a \leq q^* \leq b$, donde $q^* = \operatorname{arg max}f_Q(q)$

Entonces $[a,b]$ es el más corto dentro de los intervalos que satisfacen 1.

- En realidad, se debe minimizar la longitud del intervalo final y no siempre es proporcional a $b-a$ (mas adelante)
-Entontrar el IC (intervalo de confianza) de longitud mínima puede no ser sencillo, así que se suele repartir la probabilidad de manera simétrica.

***(Idea de la prueba 20211201 1:32:00)***

> En resumen tenemos que si queremos encontrar el intervalo mínimo de $b-a$ vamos a tomar dos valores que tengan el mismo valor de densidad y cubran al máximo alrededor.

### Ejemplo
Sea $X_1,X_2,\cdots,X_n$ una muestra aleatoria $N(\mu,\sigma^2)$
1. Si $\sigma^2$ es conocido, ¿cuál sería un $IC_{100(1-\alpha)\%}(\mu)$ de loingitud mínima?. Teniendo la variable pivote de 

$$
Z=\frac{\bar{X}_{n}-\mu}{\sigma / \sqrt{n}} \sim N(0,1)
$$

> Notemos que la variable aleatoria pivote depende de $\mu$, pero su distribución no depende de $\mu$. Además es monótona dado que en general tenemos $f(\mu) = \frac{a-\mu}{b}$ lo cual es una recta con pendiente negativa. La monotonicidad nos permite poder despejar los dos valores que definen el intervalo.

Dado que ya tenemos la condición 1) del método de la variable pivote, vamos a ahora a encontrar 2) el intervalo de longitud mínima. Haciendo uso de la simétria de la función de densidad de la variable aletoria notemos que 

![](https://cdn.mathpix.com/snip/images/7hicgPzUkh87JoRHtVxX-Wab5j5u_ZrvzphvZQCHC5U.original.fullsize.png)

donde $A_1=A_2=\frac{\alpha}{2}$ es el área que dejan las colas de la distribución normal.

Ahora, para el paso 3), tenemos que despejar a $\theta$. de este modo tenemos que

$$
\begin{split}
p\left(-z_{1-\frac{\alpha}{2}} \leq Z \leq z_{1-\frac{\alpha}{2}}\right) & = 1-\alpha \\
p\left(-z_{1-\frac{\alpha}{2}} \leq \frac{\bar{X}_{n}-\mu}{\frac{\sigma}{\sqrt{n}}} \leq z_{1-\frac{\alpha}{2}}\right) & = \\
p\left(-z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}} \leq \bar{X}_{n}-\mu \leq z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}\right) & = \\
p\left(-\bar{X}_{n}-z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}} \leq-\mu \leq-\bar{X}_{n}+z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}\right) & = \\
p\left(-\bar{X}_{n}+z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}} \geq-\mu \geq-\bar{X}_{n}-z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}\right) & = \\
p\left(\bar{X}_{n}-z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{X}_{n}+z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}\right) & =1-\alpha
\end{split}
$$

De este modo ya tenemos la fórmula para el intervalo de confianza donde para el punto 4) del método solo tener los datos y decidir un $\alpha$.

> Recordemos que el resultado debe venir de una distribución normal y se debe conocer la varianza poblacional.

Tenemos que el intervalo aleatorio está definido por $L = \bar{X}_{n}-z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}$ y $U=\bar{X}_{n}+z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}$. Ya cuando se tengan datos tendremos un intervalos de confianza $l = \bar{x}_{n}-z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}$ y $u = \bar{x}_{n}-z_{1-\frac{\alpha}{2}} \cdot \frac{\sigma}{\sqrt{n}}$

> Dado que encontrar variables pivote no es facil, de tener como compararlas, se tendria en la diferencia que nos da b-a (la longitud del intervalo).

> Es importante ver que pedir una confianza del 100% equivaldria a decir que el la recta real se encuentra nuestro parámetro lo cual era algo que ya sabiamos. De este modo es que se dice que la confianza es un impuesto que toca pagar si o si y se paga en longitud del intervalo. Es por esto que el nivel de confianza se determina antes de tomar los datos.

### **Teorema (Intervalos de confianza para funciones de los parámetros)**
Sea $l(\mathbf{x}),u(\mathbf{x})$ un intervalo del $100(1-\alpha)$% de confianza para $\theta$.

1. Sea $r(\theta)$ una función definida y no decreciente en $l(\mathbf{x}),u(\mathbf{x})$. Entonces
$$
I C_{100(1-a)\% }(r(\theta))=[r(l(\mathbf{x})), r(u(\mathbf{x}))]
$$

2. Sea $r(\theta)$ una función definida y no creciente en $l(\mathbf{x}),u(\mathbf{x})$. Entonces
$$
I C_{100(1-a)\% }(r(\theta))=[r(u(\mathbf{x})), r(l(\mathbf{x}))]
$$

#### Ejemplo

1. Sea $I C_{90 \%}(\theta)=[2,7]$. Encuentre $I C_{90 \%}(\sqrt{\theta})$.

Dado que tenemos una función no decreciente $[r(l(\mathbf{x})), r(u(\mathbf{x}))] = [\sqrt{2},\sqrt{7}]$

2. Sea $I C_{95 \%}(\theta)=[-1.2,-0.7]$. Encuentre $I C_{95 \%}(1 / \theta)$.

Dado que tenemos una función no creciente $[r(u(\mathbf{x})), r(l(\mathbf{x}))]=[\frac{1}{-0.7},\frac{1}{-1.2}]$

3. Sea $I C_{99 \%}(\theta)=[-4,1.2]$. Encuentre $I C_{99 \%}\left(\theta^{2}\right)$.

NO podemos aplicar el teorema anterior pero,

$$
\begin{split}
p[L(\mathbf{X}) \leq \theta \leq 0 \quad \cup \quad 0 \leq \theta \leq U(\mathbf{X})] & = 1-\alpha \\
p[0 \leq \theta^2 \leq L^2(\mathbf{X}) \quad \cup \quad 0 \leq \theta^2 \leq U^2(\mathbf{X})] & = 1-\alpha \\
p[0 \leq \theta^2 \leq \operatorname{max}\left\{ L^2(\mathbf{X}),U^2(\mathbf{X})] \right\} & = 1-\alpha \\
\end{split}
$$

entonces $I C_{99 \%}(\theta^2)=[0,4^2]=[0,16]$

### **Construcción de una variable pivote general, Método de la variable pivote**
Sea $X_{1}, X_{2}, \ldots, X_{n}$ una m.a. absolutamente continua con f.d. $F_{X}(x, \theta)$.

1. Sea $U_{i}:=F_{X}\left(X_{i}, \theta\right)$ o $U_{i}:=1-F_{X}\left(X_{i}, \theta\right) \Rightarrow U_{i} \sim U[0,1] \forall i=1, \ldots, n$.

2. Sea $R_{i}:=-\ln U_{i} \Rightarrow R_{i} \sim \operatorname{Exp}(1) \forall i=1, \ldots, n$.

3. $V_{1}(\mathbf{X}, \theta):=\sum_{i=1}^{n} R_{i} \sim \Gamma(n, 1)$.

Equivalentemente,

2. ' Sea $R_{i}^{*}:=-2 \ln U_{i} \Rightarrow R_{i}^{*} \sim \operatorname{Exp}(1 / 2) \forall i=1, \ldots, n$.

3. ' $V_{2}(\mathbf{X}, \theta):=\sum_{i=1}^{n} R_{i}^{*} \sim \chi^{2}(2 n)$.

Dependiendo del cumplimiento de otros requisitos, $V_{1}(\mathbf{X}, \theta):=\sum_{i=1}^{n} R_{i} \sim \Gamma(n, 1)$ o $V_{2}(\mathbf{X}, \theta):=\sum_{i=1}^{n} R_{i}^{*} \sim \chi^{2}(2 n)$ pueden jugar el papel de variables pivote para $\theta$. 

> Es importante tener en cuenta que no siempre es fácil despejar al parámetro o no se tienen expresiones analíticas para este.

### Ejemplo
Sea $X \sim Exp(\theta)$. Determine el $IC_{100(1-\alpha)\%}(\theta)$ a partir de una muestra aleatoria $X_1,X_2,\cdots,X_n$.

Recordemos que 

$$
f_{x}(x, \theta)=\theta e^{-\theta x} I_{(0,\infty)}(x) \quad F_{x}(x, \theta)=\left(1-e^{-\theta x}\right) I_{(0, \infty)}(x)
$$

Dado el teorema anterior tenemos que primero

$$
U_{i}=F_{x}\left(X_{i}, \theta\right) \quad \text{ó} \quad U_{i}=1-F_{x}\left(X_{i}, \theta\right)
$$

donde $U_i \sim U[0,1]$ para toda $i=1,2,\cdots,n$. Así escogiendo la segunda

$$
\begin{split}
U_{i} 
& = 1-F_{x}\left(X_{i}, \theta\right) \\
& = 1- \left(1-e^{-\theta X_i}\right) I_{(0, \infty)}(X_i) \\
& = e^{-\theta X_i} I_{(0, \infty)}(X_i) \\
& = e^{-\theta X_i} \quad \text{la indicadora evaluada en $X_i$ da 1 c.s.}\\
\end{split} 
$$

Segundo, por el teorema equivalente tenemos $R_{i}^{*}:=-2 \ln U_{i} \Rightarrow R_{i}^{*} \sim \operatorname{Exp}(1 / 2) \forall i=1, \ldots, n$ entonces

$$
\begin{split}
R_{i}^{*}
& = -2 \ln \left( e^{-\theta X_i} \right) \\
& = -2 \left( -\theta X_i \right) \\
& = 2 \theta X_i  \\
\end{split}
$$

Finalmente en el paso 3 del teorema tenemos que $V_{2}(\mathbf{X}, \theta):=\sum_{i=1}^{n} R_{i}^{*} \sim \chi^{2}(2 n)$, entonces

$$
\begin{split}
V_{2}(\mathbf{X}, \theta) 
& = \sum_{i=1}^{n} 2 \theta X_i \\
& = 2 \theta \sum_{i=1}^{n}  X_i \\
\end{split}
$$

De este modo, por el método de la variable pivote tenemos que el intervalo de confianza es 

$$
\begin{split}
p\left[a \leq 2 \theta \sum_{i=1}^{n} X_{i} \leq b\right] & =1-\alpha \\
p\left[\frac{a}{2 \sum_{i=1}^{n} X_{i}} \leq \theta \leq \frac{b}{2 \sum_{i=1}^{n} X_{i}}\right] & = 1-\alpha
\end{split}
$$

entonces $IC_{100(1\alpha)\%}(\theta) = \left[ \frac{a}{2 \sum_{i=1}^{n} X_{i}},\frac{b}{2 \sum_{i=1}^{n} X_{i}} \right]$ el cual es de longitud $\frac{b-a}{2 \sum_{i=1}^{n} X_{i}}$. Donde teniendo en cuenta que $\chi^2(2n)$ es una distribución unimodal.

Para ver el intervalo de longitud mínima entonces tengamos en cuenta el [teorema](#TeoremaLongitudMinima) para encontrar la longitud mínima, así tenemos que

1. $\int_a^b f_V(q) dq = 1-\alpha$ ($p( a \leq V(\mathbf{X}) \leq b) = 1 - \alpha$)

2. $f_V(a)=f_V(b)>0$

3. $a \leq q^* \leq b$, donde $q^* = \operatorname{arg max}f_V(q)$

lo que gráficamente podríamos ver como

![](https://cdn.mathpix.com/snip/images/SZaqW2R46HPHmJiheXttLxvcKqJRld7L_GgdxpV_JVE.original.fullsize.png)

Pero éste no es un problema sencillo de resolver, dada la complejidad de la distribución (esto es común en muchos casos aplicados), y en la mayoría también, como en este, no tenemos una expresión analítica. 

La solución para esto es encontrar un intervalo que tenga la confianza que necesitamos pero que no sea de longitud mínima. Para esto, al igual que en el ejemplo de la normal dejaremos la acumulación de $\frac{\alpha}{2}$ en las colas, el cual no es de longitud mínima, como en la normal, pero funciona. Entonces gráficamente podemos ver que

![](https://cdn.mathpix.com/snip/images/AI66WsARs7n3kFQXliJ3KB1kXImIYOJDFIBCgSxhQlw.original.fullsize.png)

de este modo usualmente se deja $a=\chi^2_{\alpha/2}(2n)$ y $b=\chi^2_{1-\alpha/2}(2n)$.

### **Parámetro de localización**
Sea $X$ una variable aleatoria cuya distribución depende de $\theta$. Se dice que $\theta$ es un **parámetro de localización** si la distribución de $X-\theta$ ó $X+\theta$ no depende de $\theta$. Piede identificarse si $F_X(x,\theta) = g(x \pm \theta)$ para alguna función $g$.

### **Parámetro de escala**
Sea $X$ una variable aleatoria cuya distribución depende de $\theta$. Se dice que $\theta$ es un **parámetro de escala** si la distribución de $\frac{X}{\theta}$ ó  $\theta X$ no depende de $\theta$: Puede identificarse si $F_X(x,\theta) = g(x\theta)$ ó $F_X(x,\theta) = g(\frac{x}{\theta})$ para alguna función $g$.

- No todos los parámetros pueden ser catalogados como de localización o de escala.

#### Ejemplo
El parámetro $\mu$ de una normal es un parámetro de localización. $\theta$ en la distribución doble exponencial $Exp(\theta,1)$ tambien es de localización. En la distribución de Cauchy $x_0$ tambien es un parámetro de localización.

En la distribución exponencial $\lambda$ es un parámetro de escala. la varianza en una distribución normal $\sigma$ tambien es un parámetro de escala. Tambien $\theta$ en una distribución $U[0,\theta]$

### **Teorema (Intervalos de confianza para parámetros de localización o de escala)**

Sea $X_1,X_2,\dots,X_n$ una muestra aleatoria con función de distribución de probabilidad $F_X(x,\theta)$

1. Si $\theta$ es de localización y $\hat{\theta}_n$ es MLE de $\theta$, entonces $\hat{\theta}_n-\theta$ o $\hat{\theta}_n+\theta$ es una variable pivote.

2.  Si $\theta$ es de escala y $\hat{\theta}_n$ es MLE de $\theta$, entonces $\theta\hat{\theta}_n$ o $\frac{\hat{\theta}_n}{\theta}$ es una variable pivote.

3. Si $\theta_1$ es de localización y $\hat{\theta}_{1,n}$ es MLE de $\theta_1$ y $\theta_2$ es de escala con $\hat{\theta}_{2,n}$ como su MLE, $\frac{\hat{\theta}_{1,n}-\theta}{\hat{\theta}_{2,n}}$ es una variable pivote para $\theta_1$.

#### Ejemplo 
Sea $X \sim Exp(\theta)$. Determine el $IC_{100(1-\alpha)\%}(\theta)$ a partir de una muestra aleatoria $X_1, X_2, \cdots, X_n$

La función de densidad de la muestra aleatoria es de 

$$
\begin{split}
f(x;\theta) 
& = \theta e^{-\theta x } I_{(0,\infty)}(x) \\
\end{split}
$$

Tenemos en los [ejemplos de familia exponencial](NotasDeClase3_FamiliaExponencialEvaluacionEstimadores.ipynb/#EjemploFamiliaExponencialExponencial) que $\hat{\theta}_{\text{MLE}} = \frac{1}{\bar{X}_n}$.

Si definimos $Y=\theta X$ donde vemos que el espacio del parámetro $D_Y=(0,\infty)$ tenemos que $Y \sim Exp(1)$ dado que 

$$
F_Y(y) =
\begin{cases}
0 & y \leq 0 \\
P[Y \leq y] & y\in D_Y \\
\end{cases}
$$

donde 

$$
\begin{split}
P[\theta X \leq y]
& = P \left[ X \leq \frac{y}{\theta} \right] \\
& = F_X\left( \frac{y}{\theta} \right) \\
& = \left[ 1-e^{-\theta \frac{y}{\theta}} \right] I_{(0,\infty)}(\frac{y}{\theta}) \\
& = \left[ 1-e^{-y} \right] I_{(0,\infty)}(y) \text{las indicadoras son iguales dado que no se altera el resultado c.s.} \\
\end{split}
$$

De este modo usando el teorema anterior tenemos que $\theta \hat{\theta} = \frac{\theta}{\bar{X}_n} = \frac{n \theta}{\sum X_i}$ es una cantidad pivotal. Encontrar a menudo las distribuciones es trabajo del teorema de transformación o alguna caracterización que lo permita, en este caso dada la suma de la última igualdad pdríamos ver que va por el lado de una distribución gamma invertida.

#### Ejemplo 
Sea $X_1,X_2,\cdots,X_n$ un muestra aleatoria con función de distribución $N(\mu, \sigma^2)$

1. Si $\sigma^2$ es desconocido, ¿Cual sería un $I C_{100(1-\alpha)\% } (\mu)$ de longitud mínima?

Teniendo en cuenta los ejemplos en la definición de una [variable pivote](#DefiniciosVariablePivote) vemos que una variable pivote para un intervalo de confianza del parámetro $\mu$ cuando $\sigma^2$ es desconocido es

$$
Q(\mathbf{X},\mu) = \frac{\sqrt{n}(\bar{X}_n - \mu)}{S_n} \sim t(n-1)
$$

De este modo haciendo uso del método de la variable pivote primero encontramos a y b tales

$$
\begin{split}
    p \left( a \leq \frac{\sqrt{n}(\bar{X}_n - \mu)}{S_n} \leq b \right) 
    & = p \left( a S_n \leq \sqrt{n}(\bar{X}_n - \mu) \leq b S_n \right) \\
    & = p \left( \frac{a S_n}{\sqrt{n}} \leq (\bar{X}_n - \mu) \leq \frac{b S_n}{\sqrt{n}} \right) \\
    & = p \left( \frac{a S_n}{\sqrt{n}} -\bar{X}_n \leq -\mu \leq \frac{b S_n}{\sqrt{n}} - \bar{X}_n \right) \\
    & = p \left( \bar{X}_n - \frac{a S_n}{\sqrt{n}} \geq \mu \geq \bar{X}_n - \frac{b S_n}{\sqrt{n}} \right) \\
    & = p \left( \bar{X}_n - \frac{b S_n}{\sqrt{n}} \leq \mu \leq \bar{X}_n - \frac{a S_n}{\sqrt{n}} \right)\\
    & = 1 - \alpha
\end{split}
$$

De este modo el intervalo de confianza 

$$
I C_{100(1-\alpha)\% } (\mu) = \left[ \bar{X}_n - \frac{b S_n}{\sqrt{n}} \quad , \quad  \bar{X}_n - \frac{a S_n}{\sqrt{n}} \right]
$$

La longitud del intervalo viene dada por 

$$
(b-a)\frac{S_n}{\sqrt{n}}
$$

> Es importante tener en cuenta que el teorema para minimizar la longitud del intervalo es condición necesaria que la longitud dependa de a y b. Esto es importante porque en algunos casos, la longitud no dependerá de estos valores.

Vamos entonces a encontrar a $a$ y $b$ tales que $b-a$ sea la mínima longitud sujeto a 

1. $\int_a^b f_Q(q) dq = 1-\alpha$  ( $p( a \leq Q(\mathbf{X}) \leq b) = 1 - \alpha$ )
2. $f_Q(a)=f_Q(b)>0$
3. $a \leq q^* \leq b$, donde $q^* = \operatorname{arg max}f_Q(q)$

Pero teniendo en cuenta que la distribución t es simétrica respecto a la mediana entonces tenemos que en las colas se tendrá $\frac{\alpha}{2}$ de probabilidad acumulada. Gráficamente es 

![](https://cdn.mathpix.com/snip/images/M1QlsBlfqmnEwKRDo30qJ3GP4Erd0vcpmEfj2Qp-nqo.original.fullsize.png)

entonces $a=t_{\frac{\alpha}{2}}(n-1)$ y $b=t_{1 - \frac{\alpha}{2}}(n-1)$ y cumplimos por ende las 3 condiciones. 

Por lo tanto el intervalo de longitud mínima para el parámetro $\mu$ con $\sigma^2$ desconocido es 


$$
\begin{align}
I C_{100(1-\alpha)\% } (\mu) 
& = \left[ \bar{X}_n - \frac{t_{1 - \frac{\alpha}{2}}(n-1) S_n}{\sqrt{n}} \quad , \quad  \bar{X}_n - \frac{t_{\frac{\alpha}{2}}(n-1) S_n}{\sqrt{n}} \right] \\
& = \left[ \bar{X}_n - \frac{t_{1 - \frac{\alpha}{2}}(n-1) S_n}{\sqrt{n}} \quad , \quad  \bar{X}_n + \frac{t_{1 - \frac{\alpha}{2}}(n-1) S_n}{\sqrt{n}} \right]
\end{align}
$$

### **Métodos para construir variables pivotes asintóticas**

Los intervalos anteriores funcionan en particular para todo tamaño de muestra (incluso 2); pero muchas veces en la práctica se hace necesario encontrar una variable pivote asintótica. Es decir necesitamos encontrar una variable aleatoria que a medida que la muestra se va acercando al infinito entonces ésta va cumpliendo las condiciones de una variable aleatoria pivote. 

Teniendo en cuenta la definición de [variable aleatoria pivote](#DefiniciosVariablePivote) vamos a construir la definición de variable aleatoria pivote asintótica.

<a id='DefiniciosVariablePivoteAsintotica'></a>
#### **Variable pivote**
Una variable aleatoria $Q(\mathbf{X},\theta)$ es una **variable pivote asintótica** si:

- $Q(\mathbf{X})$ es una función monótona en su segundo argumento (la v.a. pivote crece o decrece a medida que los valores de $\theta$ crece o decrece, o lo análogamente contrario).

- Su expresión depende del parámetro desconocido $\theta$,

- PERO, su distribución asintótica no depende del parámetro desconocido alguno.

> Para este punto notemos que la codición de monotonía es algo que es deseable más no es algo que tenga que ser estrictamente necesaria. Esto dado que $Q(\cdot,\theta)$ una variable aleatoria pivote es monótona por definición si $Q^{-1}(\cdot,\theta)$ y esto nos deja que $p[a \leq Q(\mathbf{X},\theta) \leq b] = 1 - \alpha$ nos deje $p[Q(\mathbf{X},a) \leq Q(\mathbf{X},b)] = p[L(\mathbf{X},\theta) \leq U(\mathbf{X},\theta)] = 1 - \alpha$. En caso tal que $Q(\cdot,\theta)$ sea una variable aleatoria pivote que no sea monótona, no se tendría sólo un intervalo.

#### **Construcción de un intervalo de confianza usando el TCL**

##### **Método del teorema central del límite:**
Sea $X_1, X_2, \cdots, X_n$ una muestra aleatoria parametrizada por $\theta$ para la cual el TCL aplica, es decir $\sqrt{n}(\bar{X} - \mu(\theta)) \overset{d}{\underset{n \to \infty}{\longrightarrow}} N(0, \sigma^2(\theta))$

**(Posibilidad 1):** Usar como variable pivote a 

$$
Q(\mathbf{X},\theta) = \frac{\sqrt{n}(\bar{X}_n - \mu(\theta))}{\sigma(\theta)} \overset{d}{\underset{n \to \infty}{\longrightarrow}}N(0,1)
$$

y buscar despejar $\theta$

**(Posibilidad 2):** Usar como variable pivote a 

$$
Q(\mathbf{X},\theta) = \frac{\sqrt{n}(\bar{X}_n - \mu(\theta))}{\sigma(\hat{\theta})} \overset{d}{\underset{n \to \infty}{\longrightarrow}}N(0,1)
$$

con $\hat{\theta}$ un estimador consistente y buscar despejar $\theta$.

> Recordemos el [teorema de Slutsky](#TeoremaSlutsky).

**(Posibilidad 3 - Mét Delta):** Usar como variable pivote a 

$$
Q(\mathbf{X},\theta) = \sqrt{n}( g(\bar{X}_n) - g(\mu(\theta))) \overset{d}{\underset{n \to \infty}{\longrightarrow}}N(0,k^2)
$$

con $g$ una transformación estabilizadora de la varianza y buscar despejar $\theta$.

#### Ejemplo
Sea $X \sim Exp(\theta)$. Determine el $IC_{100(1-\alpha)\%}(\theta)$ a partir de una muestra aleatoria $X_1, X_2, \cdots, X_n$. Recordemos que $\mu(\theta) = \frac{1}{\theta}$ y que $\sigma^2(\theta) = \frac{1}{\theta^2}$

Por la posibilidad 1 tenemos que 

$$
Q(\mathbf{X},\theta) = \frac{\sqrt{n}(\bar{X}_n - \mu(\theta))}{\sigma(\theta)} \overset{d}{\underset{n \to \infty}{\longrightarrow}}N(0,1)
$$

Luego de manera aproximada

$$
\begin{split}
p\left[ a \leq \frac{\sqrt{n}(\bar{X}_n - \mu(\theta))}{\sigma(\theta)} \leq b \right] 
& = p\left[ a \leq \frac{\sqrt{n}(\bar{X}_n - \frac{1}{\theta})}{\frac{1}{\theta}} \leq b \right] \\
& = p\left[ a \leq \sqrt{n}(\theta \bar{X}_n - 1 ) \leq b \right] \\
& = p\left[ \frac{a}{\sqrt{n}} \leq \theta \bar{X}_n - 1 \leq \frac{b}{\sqrt{n}} \right] \\
& = p\left[ \frac{a}{\sqrt{n}} +1 \leq \theta \bar{X}_n \leq \frac{b}{\sqrt{n}} +1 \right] \\
& = p\left[ \frac{a}{\bar{X}_n\sqrt{n}} +1 \leq \theta \leq \frac{b}{\bar{X}_n\sqrt{n}} +1 \right] \\
& = p\left[ \frac{a + \sqrt{n}}{\bar{X}_n\sqrt{n}} \leq \theta \leq \frac{b + \sqrt{n}}{\bar{X}_n\sqrt{n}} \right] \\
& \approx 1-\alpha
\end{split}
$$

De este modo tenemos que $I C A_{100(1-\alpha)\% }(\theta) = \left[ \frac{a + \sqrt{n}}{\bar{X}_n\sqrt{n}} , \frac{b + \sqrt{n}}{\bar{X}_n\sqrt{n}} \right]$ (asintótico) donde la longitud del intervalo es $\operatorname{Long}(ICA) = \frac{b-a}{\bar{X}_n\sqrt{n}}$ lo cual es proporcional a $b-a$ y de este modo para que $b-a$ sea de longitud mínima $b=z_{1-\frac{\alpha}{2}}$ y $a=-z_{1-\frac{\alpha}{2}}$ dado que la normal es una función simétrica respecto a la mediana y por ende los percentiles de la normal $z_{1-\frac{\alpha}{2}}$ son equidistantes. Así

$$
I C A_{100(1-\alpha)\% }(\theta) = \left[ \frac{-z_{1-\frac{\alpha}{2}} + \sqrt{n}}{\bar{X}_n\sqrt{n}} , \frac{z_{1-\frac{\alpha}{2}} + \sqrt{n}}{\bar{X}_n\sqrt{n}} \right]
$$

Por posibilidad 2 entonces

$$
Q(\mathbf{X},\theta) = \frac{\sqrt{n}(\bar{X}_n - \mu(\theta))}{\sigma(\hat{\theta})} \overset{d}{\underset{n \to \infty}{\longrightarrow}}N(0,1)
$$

Luego nuevamente de manera aproximada

$$
\begin{split}
p\left[ a \leq \frac{\sqrt{n}(\bar{X}_n - \mu(\theta))}{\sigma(\hat{\theta})} \leq b \right] 
= 1-\alpha
\end{split}
$$

donde tenemos que como $\bar{X}_n$ es consistente para $\frac{1}{\theta}$ lo que es equivalente a decir que $\frac{1}{\bar{X}_n}$ es consistente para $\theta$. Dicho de otro modo tenemos que 

$$
\bar{X}_n \overset{p}{\underset{n \to  \infty}{\longrightarrow}} \frac{1}{\theta} \iff \frac{1}{\bar{X}_n} \overset{p}{\underset{n \to  \infty}{\longrightarrow}} \theta
$$

entonces

$$
\begin{split}
p\left[ a \leq \frac{\sqrt{n}(\bar{X}_n - \mu(\theta))}{\sigma(\hat{\theta})} \leq b \right]
& = p\left[ a \leq \frac{\sqrt{n}(\bar{X}_n -\frac{1}{\theta})}{\bar{X}_n} \leq b \right] \\
& = p\left[ a\bar{X}_n \leq \sqrt{n}(\bar{X}_n -\frac{1}{\theta}) \leq b\bar{X}_n \right] \\
& = p\left[ \frac{a\bar{X}_n}{\sqrt{n}} \leq \bar{X}_n -\frac{1}{\theta} \leq  \frac{b\bar{X}_n}{\sqrt{n}} \right] \\
& = p\left[ \frac{a\bar{X}_n}{\sqrt{n}} - \bar{X}_n \leq  -\frac{1}{\theta} \leq  \frac{b\bar{X}_n}{\sqrt{n}} - \bar{X}_n \right] \\
& = p\left[ \bar{X}_n - \frac{a\bar{X}_n}{\sqrt{n}}  \geq  \frac{1}{\theta} \geq   \bar{X}_n - \frac{b\bar{X}_n}{\sqrt{n}}  \right] \\
& = p\left[ \frac{\bar{X}_n\sqrt{n} - a\bar{X}_n}{\sqrt{n}}  \geq  \frac{1}{\theta} \geq \frac{\bar{X}_n\sqrt{n} -b\bar{X}_n}{\sqrt{n}}  \right] \\
& = p\left[ \frac{\bar{X}_n( \sqrt{n} - a )}{\sqrt{n}}  \geq  \frac{1}{\theta} \geq \frac{\bar{X}_n( \sqrt{n} - b )}{\sqrt{n}}  \right] \\
& = p\left[ \frac{\sqrt{n}}{\bar{X}_n( \sqrt{n} - a )}  \leq  {\theta} \leq \frac{\sqrt{n}}{\bar{X}_n( \sqrt{n} - b )}  \right] \\
& \approx 1-\alpha\\
\end{split}
$$

Entonces tenemos que $I C A_{100(1-\alpha)\% }(\theta) = \left[ \frac{\sqrt{n}}{\bar{X}_n( \sqrt{n} - a )} , \frac{\sqrt{n}}{\bar{X}_n( \sqrt{n} - b )}  \right]$ donde podemos ver que la longitud del intervalo no depende de $b-a$, lo que significa que no tenemos un intervalo de longitud mínima. De este modo tendríamos que maximizar y minimizar la longitud en cada caso y como el resultado de esto no es lo suficientemente distinto que el ya obtenido dejamos este intervalo. Entonces dejamos $b=-a=z_{1-\frac{1}{\alpha}}$ haciendo la salvedad de que no es el intervalo de longitud mínima.


Posibilidad 3 

Usamos como variable pivote 

$$
\begin{split}
Q(\mathbf{X},\theta) 
& = \sqrt{n}(\bar{X}_n - \mu(\theta) \overset{d}{\underset{n \to \infty}{\longrightarrow}} N(0,\sigma(\theta)^2) \\
& = \sqrt{n}( g(\bar{X}_n) - g(\mu(\theta))) \overset{d}{\underset{n \to \infty}{\longrightarrow}}N(0,g'^2(\mu)\sigma(\theta)^2) \\
& = \sqrt{n}( g(\bar{X}_n) - g(\mu(\theta))) \overset{d}{\underset{n \to \infty}{\longrightarrow}}N(0,k^2) \\
\end{split}
$$

Es decir tenemos que encontrar una función $g$ donde la convergencia en distribución nos de una normal de media $0$ y varianza $k^2$ constante. (20220110 15:38)





#### Ejemplo
Sea $X \sim Ber(\theta)$. Determine un $I C A_{100(1-\alpha)\% }(\theta)$ a partir de una muestra aleatoria $X_1, X_2, \cdots, X_n$ usando las tres posibilidades.

Tengamos en cuenta que en el modelo Bernoulli $\mu(\theta) = E[X_i] = \theta$ y además $\sigma^{2}(\theta) = Var(X_i) = \theta(1-\theta)$

Por la posibilidad 1 tenemos que la variable aletoria pivote

$$
Q(\mathbf{X},\theta) = \frac{\sqrt{n}(\bar{X}_n - \mu(\theta))}{\sigma(\theta)} \overset{d}{\underset{n \to \infty}{\longrightarrow}}N(0,1)
$$

Luego de manera aproximada

$$
\begin{split}
p\left[ a \leq \frac{\sqrt{n}(\bar{X}_n - \mu(\theta))}{\sigma(\theta)} \leq b \right]
& = p\left[ a \leq \frac{\sqrt{n}(\bar{X}_n - \theta)}{\sqrt{\theta(1-\theta)}} \leq b \right] \\
& \approx 1-\alpha
\end{split}
$$

Como no tenemos monotonicidad en $\theta$ asumiendo que $b=-a=Z_{1-\frac{\alpha}{2}}$

$$
\begin{split}
p\left[ a \leq \frac{\sqrt{n}(\bar{X}_n - \theta)}{\sqrt{\theta(1-\theta)}} \leq b \right] 
& = p\left[ \left| \frac{\sqrt{n}(\bar{X}_n - \theta)}{\sqrt{\theta(1-\theta)}} \right| \leq Z_{1-\frac{\alpha}{2}} \right] 
& \approx 1-\alpha
\end{split}
$$

Donde elevando a ambos lados al cuadrado usando la fórmula cuadrática nos deja un intervalo de confianza. 

> Podemos ver que la monotonicidad es una condición suficiente más no necesaria para la estimación del intervalo de mínima longitud.

Por posibilidad 2 entonces

$$
Q(\mathbf{X},\theta) = \frac{\sqrt{n}(\bar{X}_n - \mu(\theta))}{\sigma(\hat{\theta})} \overset{d}{\underset{n \to \infty}{\longrightarrow}}N(0,1)
$$

Luego nuevamente de manera aproximada

$$
\begin{split}
p\left[ a \leq \frac{\sqrt{n}(\bar{X}_n - \mu(\theta))}{\sigma(\hat{\theta})} \leq b \right] 
& = p\left[ a \leq \frac{\sqrt{n}(\bar{X}_n - \mu(\theta))}{\sigma(\hat{\theta})} \leq b \right] \\
= 1-\alpha
\end{split}
$$

donde tenemos que como $\bar{X}_n$ es consistente para $\theta$ lo que nos deja que 

$$
\begin{split}
p\left[ a \leq \frac{\sqrt{n}(\bar{X}_n - \mu(\theta))}{\sigma(\hat{\theta})} \leq b \right] 
& = p\left[ a \leq \frac{\sqrt{n}(\bar{X}_n - \theta)}{\sqrt{\hat{\theta}(1-\hat{\theta})}} \leq b \right] \\
& = p\left[ a \leq \frac{\sqrt{n}(\bar{X}_n - \theta)}{\sqrt{\bar{X}_n(1-\bar{X}_n)}} \leq b \right] \\
& = p\left[ a\sqrt{\bar{X}_n(1-\bar{X}_n)} \leq  \sqrt{n}(\bar{X}_n - \theta) \leq b\sqrt{\bar{X}_n(1-\bar{X}_n)} \right] \\
& = p\left[ \frac{a\sqrt{\bar{X}_n(1-\bar{X}_n)}}{\sqrt{n}} \leq  \bar{X}_n - \theta \leq \frac{b\sqrt{\bar{X}_n(1-\bar{X}_n)}}{\sqrt{n}} \right] \\
& = p\left[ \frac{a\sqrt{\bar{X}_n(1-\bar{X}_n)} - \bar{X}_n\sqrt{n}}{\sqrt{n}}  \leq   - \theta \leq \frac{b\sqrt{\bar{X}_n(1-\bar{X}_n)} -  \bar{X}_n\sqrt{n}}{\sqrt{n}} \right] \\
& = p\left[ \frac{\bar{X}_n\sqrt{n} - a\sqrt{\bar{X}_n(1-\bar{X}_n)}}{\sqrt{n}}  \geq   \theta \geq \frac{\bar{X}_n\sqrt{n}- b\sqrt{\bar{X}_n(1-\bar{X}_n)}}{\sqrt{n}} \right] \\
& = p\left[ \frac{\bar{X}_n\sqrt{n} - b\sqrt{\bar{X}_n(1-\bar{X}_n)}}{\sqrt{n}} \leq   \theta \leq \frac{\bar{X}_n\sqrt{n} - a\sqrt{\bar{X}_n(1-\bar{X}_n)}}{\sqrt{n}} \right] \\
& = 1-\alpha
\end{split}
$$

Ahora como tenemos que $\operatorname{Long} ICA$ es proporcional a $b-a$ entonces tenemos que $b = Z_{1-\frac{\alpha}{2}} = -a$ es un $ICA$ de longitud mínima. De este modo tenemos que

$$
ICA_{100(1-\alpha)\%}(\theta) = \left[ \frac{\bar{X}_n\sqrt{n} - Z_{1-\frac{\alpha}{2}}\sqrt{\bar{X}_n(1-\bar{X}_n)}}{\sqrt{n}} , \frac{\bar{X}_n\sqrt{n} + Z_{1-\frac{\alpha}{2}}\sqrt{\bar{X}_n(1-\bar{X}_n)}}{\sqrt{n}}  \right]
$$

20220110 25:35

![](https://cdn.mathpix.com/snip/images/fH4inW9yEaGykeKmPeoqQJHDfj_kDD7UQMlDg-aQpIU.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/EkHvaQl-GYQg1RvGrveEIDZy84QIrnuU0P7if1Ps8EQ.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/YZCZKXbFlH8NN_DKORtgvBLzhVaLu4vxkL1VrrapwOA.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/eb2c5nYkPdS-0PCEIQXM_osgFf3PSFfhCucDhrugH0w.original.fullsize.png)

#### **Construcción de un intervalo de confianza usando el MLE**
En algunos casos,  como cuando tenemos datos a los que no podemos aplicarle el teorema central de límite, es mas útil desarrollar el intervalo por haciendo uso de MLE de los datos siempre que tengamos condiciones de regularidad.

##### **Método del MLE:**
Sea $X_{1}, X_{2}, \ldots, X_{n}$ una muestra aleatoria para la cual $\hat{\theta}_{\mathrm{MLE}}$ existe y hay condiciones de regularidad, es decir: $\sqrt{n}\left(\hat{\theta}_{\mathrm{MLE}}-\theta\right) \overset{d}{\underset{n \to \infty}{\longrightarrow}} N\left(0, \frac{1}{I(\theta)}\right)$

- (Posibilidad 1): Usar como variable pivote a

$$
Q(\mathbf{X}, \theta)=\sqrt{n I(\theta)}\left(\hat{\theta}_{\mathrm{MLE}}-\theta\right) \overset{d}{\underset{n \to \infty}{\longrightarrow}} N(0,1)
$$ 

y buscar despejar $\theta$.

- (Posibilidad 2): Usar como variable pivote a

$$
Q(\mathbf{X}, \theta)=\sqrt{n I\left(\hat{\theta}_{\mathrm{MLE}}\right)}\left(\hat{\theta}_{\mathrm{MLE}}-\theta\right) \overset{d}{\underset{n \to \infty}{\longrightarrow}} N(0,1)
$$ 

y buscar despejar $\theta$.

- (Posibilidad 3-Mét. Delta): Usar como variable pivote a

$$
Q(\mathbf{X}, \theta)=\sqrt{n}\left(g\left(\hat{\theta}_{\mathrm{MLE}}\right)-g(\theta)\right) \overset{d}{\underset{n \to \infty}{\longrightarrow}} N\left(0, k^{2}\right)
$$

con $g$ una transformación estabilizadora de varianza y buscar despejar $\theta$.

####  Ejemplo
Sea $X_1,X_2,\cdots,X_n$ una muestra aleatoria donde $X  \sim Exp(\theta)$ Detemine un intervalo de confianza $IC_{100(1-\alpha)\%}(\theta)$ asintótico a partir del MLE de la muestra.

Teniendo en cuenta que $\hat{\theta}_{\text{MLE}} = \frac{1}{\bar{X}_n}$ es el estimador del parámetro por máxima verosimilitud y que $I(\theta) = \frac{1}{\theta^2}$ es la información de Fisher del parámetro entonces

- Posibilidad 1

Usando como variable pivote a

$$
\begin{split}
Q(\mathbf{X}, \theta) 
& =\sqrt{n I(\theta)}\left(\hat{\theta}_{\mathrm{MLE}}-\theta\right) \overset{d}{\underset{n \to \infty}{\longrightarrow}} N(0,1) \\
& =\sqrt{n \frac{1}{\theta^2}}\left(\hat{\theta}_{\mathrm{MLE}}-\theta\right) \overset{d}{\underset{n \to \infty}{\longrightarrow}} N(0,1) \\
& = \frac{\sqrt{n}}{\theta}\left(\hat{\theta}_{\mathrm{MLE}}-\theta\right) \overset{d}{\underset{n \to \infty}{\longrightarrow}} N(0,1) \\
& = \sqrt{n}\left(\frac{\hat{\theta}_{\mathrm{MLE}}}{\theta} - 1\right) \overset{d}{\underset{n \to \infty}{\longrightarrow}} N(0,1) \\
\end{split}
$$ 

Entonces tenemos que 

$$
\begin{split}
p\left[ a \leq \sqrt{n}\left(\frac{\hat{\theta}_{\mathrm{MLE}}}{\theta} - 1\right) \leq b \right] 
& = p\left[ \frac{a}{\sqrt{n}} \leq \frac{\hat{\theta}_{\mathrm{MLE}}}{\theta} - 1 \leq \frac{b}{\sqrt{n}} \right] \\
& = p\left[ \frac{a + \sqrt{n}}{\sqrt{n}} \leq \frac{\hat{\theta}_{\mathrm{MLE}}}{\theta} \leq \frac{b + \sqrt{n}}{\sqrt{n}} \right] \\
& = p\left[ \frac{\sqrt{n}}{b + \sqrt{n}} \leq \frac{\theta}{\hat{\theta}_{\mathrm{MLE}}} \leq \frac{\sqrt{n}}{a + \sqrt{n}} \right] \\
& = p\left[ \frac{\hat{\theta}_{\mathrm{MLE}}\sqrt{n}}{b + \sqrt{n}} \leq \theta \leq \frac{\hat{\theta}_{\mathrm{MLE}}\sqrt{n}}{a + \sqrt{n}} \right] \\
& = p\left[ \frac{1}{\bar{X}_n}\frac{\sqrt{n}}{b + \sqrt{n}} \leq \theta \leq \frac{1}{\bar{X}_n}\frac{\sqrt{n}}{a + \sqrt{n}} \right] \\
& \approx 1- \alpha
\end{split}
$$

Donde al notar que la longitud del intervalo no depende de $b-a$, el $ICA_{100(1-\alpha)\%}(\theta)$ no es un intervalo dado por $b=-a=Z_{1-\alpha}$. Entonce el intervalo es

$$
ICA_{100(1-\alpha)\%}(\theta) = \left[ \frac{1}{\bar{X}_n}\frac{\sqrt{n}}{\sqrt{n} + Z_{1-\alpha}} , \frac{1}{\bar{X}_n}\frac{\sqrt{n}}{\sqrt{n} - Z_{1-\alpha}}  \right]
$$


- Posibilidad 2 
20220110 43:00 sencillo 

- Posibilidad 3

20220110 45:00 sencillo 

### **Estimación  por intervalo de medias, varianzas y proporciones** 

En la práctica nos encontraremos más frecuentemente con el hecho de que se pretenda conocer el valor de la media o varianza y para esto hay una serie de fórmulas para llegar a este desarrollo.

#### **Para la media**

![](https://cdn.mathpix.com/snip/images/V_YVOAjszU2JWzVAbhwDBvC4mRfiSHLbpZjNjbVQWjQ.original.fullsize.png)

Recordando 

![](https://cdn.mathpix.com/snip/images/5QW7Hu6HysqeqXSOMC2iHXX47CHLjbu2fljJaKT8m1g.original.fullsize.png)

![](https://cdn.mathpix.com/snip/images/EOfLPOOX2CB4a0uoN1Kl2dQKQHOZTrtIGGGRFsjZzvs.original.fullsize.png)

![](https://cdn.mathpix.com/snip/images/4vvwcF8B1N8MPQPmtFzNq287emslBUwTmwLJ7BfpJOE.original.fullsize.png)

Siguiendo estas medologías veamos algunos ejemplos desde la parte aplicada

##### Ejemplo 1
![](https://cdn.mathpix.com/snip/images/Ddp8RzzRPRjPx3q_eUnihDm2UXtCx7kggrAFvSbX8HY.original.fullsize.png)

Teniendo en cuenta que no encontramos en un caso como el de 3 entonces

![](https://cdn.mathpix.com/snip/images/fiz9zSUDkaN-QAFLlfBy4iuh5X_TuOGb0yn0r7kuE1Q.original.fullsize.png)

##### Ejemplo 2 
![](https://cdn.mathpix.com/snip/images/1vJwc2-y68SRzwDyHcG1cpTpVmEoy8EaANaZiW79Edg.original.fullsize.png)

Dado que podemos suponer vagamente que los datos son normales vamos a escoger ese camino, de este modo como no conocemos la varianza poblacional entonces escogeremos el caso 2. Así tenemos que

![](https://cdn.mathpix.com/snip/images/v7WITlwbZG6TtiZujKxh50ZaHLGJ25OBMONe_HXAPT8.original.fullsize.png)




    





#### **Para la varianza**

![](https://cdn.mathpix.com/snip/images/n-pWsUTqGeOijMJgjbIR7brLor_--l0w__7HNciyfaM.original.fullsize.png)

Recordando 

![](https://cdn.mathpix.com/snip/images/Se6JPV_08ocgvfU_nIp_1UgQG7irRhjg7LqXH4wG4vI.original.fullsize.png)

![](https://cdn.mathpix.com/snip/images/hpXmaIL4vPztBIQQiNFY6stXuEVWIzgyEf10VL-GSuU.original.fullsize.png)

![](https://cdn.mathpix.com/snip/images/vEAk__XoBYzbNu1nZc-2BYlfGr0dVj5B-WUJ8qmEvSY.original.fullsize.png)

Condicion importante

![](https://cdn.mathpix.com/snip/images/tj-Qgr2hMLQcxZ1bfBTHMMf7zy3oHIA1Qc59sW_GdC0.original.fullsize.png)

##### Ejemplo 

![](https://cdn.mathpix.com/snip/images/gkwjOExVG1pkDEkX5Kd0_IDYVHs8kbH7wYhnEbQRavc.original.fullsize.png)

####  **Proporciones**

![](https://cdn.mathpix.com/snip/images/KXHwktHGfC3voJlGCO4ZVS6bnLmHyCK3mXuA0iQzNW0.original.fullsize.png)

![](https://cdn.mathpix.com/snip/images/IWTtzxYQ4-8-n9-1Vi370DCDp04kmN9ZT_R_UokGiPE.original.fullsize.png)

##### Ejemplo 

![](https://cdn.mathpix.com/snip/images/xSRjuqu2T72gKYZp7_lTE3dx4MA7B8FTOUvwXCTgbAw.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/Oddzg_tcULeK1aDbjDaWo3Oyxr-2D5SzrLNJVf_RuQQ.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/udLVBYvtSGJpUW8r29XW530ulAORdtPG4OfSd5Ungco.original.fullsize.png)


### **Muestras Pareadas**
Se dice que  se tienen **muestras pareadas** cuando un mismo grupo de individuos es medido en dos momentos diferentes. Veamos por un momento la siguiente tabla que representa la medición del azúcar en 10 pacientes antes y despues de tomar un medicamento para reducir el nivel de azúcar.

| Paciente | Medición antes (mg//dL) | Medición después (mg//dL) |
| :---: | :---: | :---: |
| 1 | 144 | 121 |
| 2 | 114 | 124 |
| 3 | 148 | 131 |
| 4 | 116 | 92 |
| 5 | 112 | 83 |
| 6 | 123 | 133 |
| 7 | 141 | 112 |
| 8 | 134 | 117 |
| 9 | 139 | 117 |
| 10 | 135 | 139 |

Hasta este momento en el curso hemos visto que las medidas por lo general caben en un vector cuya  dimensión es el tamaño de la muestra. Vamos a empezar a extender este concepto poco a poco, donde en este caso tenemos un grupo de individuos donde vamos a tomar una medición antes y una  despues de la suministración de un medicamento. Esto puede estudiarse más a profundidad en estadística longitudinal.

- El parámetro de interés será el cambio promedio de respuesta $\mu_D$

- Para poder calcular un intervalo de confianza, entonces es necesario calcular (para cada individuo) la diferencia entre los valores de después menos los de antes $d_i=x_{i,\text{después} - x_{i,\text{antes}}}$


| Paciente | Medición antes (mg//dL) | Medición después (mg//dL) | Diferencia $d_i$ |
| :---: | :---: | :---: | :---: |
| 1 | 144 | 121 | 121-144=-23 |
| 2 | 114 | 124 | 10 |
| 3 | 148 | 131 | -17 |
| 4 | 116 | 92 | -24 |
| 5 | 112 | 83 | -29 |
| 6 | 123 | 133 | 10 |
| 7 | 141 | 112 | -29 |
| 8 | 134 | 117 | -17 |
| 9 | 139 | 117 | -22 |
| 10 | 135 | 139 | 4 |

> Es importante que en este caso el signo sigue brindando información luego de tomar la distancia. Es decir que en este caso nos  interesan más las muestras longitudinal donde su valor sea cero. 

Teniendo en cuenta luego el estimador para esa distancia, como lo podría ser el promedio ($\hat{\mu}_D = \bar{X}_n$) , entonces vemos que tenemos algunos de los siguientes casos.

![](https://cdn.mathpix.com/snip/images/k_0ockoJ44QoBKhgEJtNQQBQEMGeVB0XqyNDX8Bx4VQ.original.fullsize.png)

> Tengamos en cuenta que nuestro parámetro de interés es $\mu_D$ el promedio de las distracias.

Similar a lo visto anteriormente tenemos el cálculo de las estimaciones del intervalo según lo que sepamos de la varianza y la distribución de los datos.

![](https://cdn.mathpix.com/snip/images/1LochDmnKfQrYArzI-krVJ43he3dnhG_a8RXEFYcSdw.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/S3AguwXXFpoZ-jH66JSuBlRbxXRbfcSiVmwSO5281Pw.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/FF95taQD3oBs594n0LCBmuUUWgmysayHHbT6rG1sbe8.original.fullsize.png)



### Ejemplo  
Asuma que en este caso los datos anteriores provienen de una distribución normal y que una vez calculadas las diferencias se tiene que 

$$n=10$$

$$\bar{d}_{10}=-13.7 \mathrm{mg} / \mathrm{dL}$$ 

$$s_{D, 10}=15.59 \mathrm{mg} / \mathrm{dL}$$

Teniendo en cuenta que no conocemos la varianza poblacional, entonces vamos a hacer uso del caso 2.

| Confianza | alpha | 1-(a)/(2) | t(9) |
| :---: | :---: | :---: | :---: | 
| 99% | 0.01 | 0.995 | 3.25 |

Así el intervalo de confianza es teniendo en cuenta que $t_{0.995}(9)=3.25$

$$
\begin{split}
IC_{100(1-0.01)\%} (\mu_D) 
& = \left[ \bar{d} - t_{1-\frac{\alpha}{2}}(n-1)\frac{S_D}{\sqrt{n}} , \bar{d} + t_{1-\frac{\alpha}{2}}(n-1)\frac{S_D}{\sqrt{n}} \right] \\
& = \left[ -13.7 - 3.25 \frac{15.59}{\sqrt{10}} , \bar{d} +  -13.7 + 3.25 \frac{15.59}{\sqrt{10}} \right] \\
& = \left[ -29.72 , 2.32 \right] \\
\end{split}
$$

> Para este tamaño de muestra y estos pacientes debemos ser muy cuidadosos con al interpretación que le vamos a dar a los datos dado que como podemos ver con una confianza del $99\%$ el valor del parámetro se encuentra en el intervalo $\left[ -29.72 , 2.32 \right]$ es decir que cabe la posibilidad de que este valor pueda ser cero o algún numero positivo lo cual indica que el medicamento no esta haciendo efecto o de hecho aumenta los niveles de azúcar. De este modo debemos decir que no hay certeza de que el medicamento está haciendo efecto.

> Es importante que antes de ver los resultados se fije la confianza como bien hemos repetido en toda esta sección, tanto por cuestiones prácticas como por cuestiones éticas. Pero dado que detrás de la generación de éstos medicamentos y casi de todo producto, hay un trabajo de marketing, investigación e inversión es importante en ocasiones encontrar soluciones para tener cada vez más certeza. En este caso podríamos aumentar el tamaño de muestra el cual, al estar en un denomidador reduciría el tamaño del intervalo y así podríamos ver mejor los límites del intervalo.



### **Muestras independientes**
Diferente al concepto anterior, se dice que se tienen **muestras independientes** cuando se recogen datos de dos grupos representativos de la población de manera independiente.

| **Muestra 1** | **Muestra 2** |
| --- | --- |
| $x_1$ | $y_1$ |
| $x_2$ | $y_2$ |
| $x_3$ | $y_3$ |
| $\vdots$ | $\vdots$ |
| $x_n$ | $y_m$ |

> Notemos que los tamaños de muestra son $n$ y $m$ diferentes. 

- El parámetro de interés será la diferencia de promedios $\mu_x - \mu_y$

- Esta situación es aplicable cuando se quiere, por ejemplo, evaluar la diferencia en valores de una variable cuantitativa entre dos grupos de referencia (dados por una variable cualitativa).

    - Ejemplo 1: Diferencia en la edad promedio de hombres y mujeres en una encuesta
    
    - Ejemplo 2: Diferencia en el contenido promedio de estrógeno entre mujeres embarazadas y mujeres no embarazadas
    
    - Ejemplo 3: Diferencia en la resistencia promedio de dos aleaciones diferentes.

![](https://cdn.mathpix.com/snip/images/-T_J9mSm_QJWxY9TGgSrnDOVohvBffZi5h7qDc0E5YM.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/4EEfpJo_1Ab85bGLwvnsQ7xREF4h6vxRniaQ8nyVrOU.original.fullsize.png)

> Notemos que la forma como esta dispuesto el diagrama es tal que primero nos pregunta si conocemos las varianzas poblacionales y luego nos pregunta si son iguales.De momento esto lo veremos con el cálculo de la varianza muestral, pero también esto se puede hacer mirando el intervalo de confianza para la varianza de la población en ambas muestra y más adelante usando el método de prueba de hipótesis


![](https://cdn.mathpix.com/snip/images/g4Brhz4N8Ejd_VSm3uAxOf0V8p__EU6EESMlllKn5Iw.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/jaVVuhTrN-2mA4QGSqP8WcMB0hD8_eBCD9grCwUJBXU.original.fullsize.png)

![](https://cdn.mathpix.com/snip/images/jf7IIEwYat-wKIY6Z43Mp6MBsSkxlXzK-15T0qt4HXE.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/ler-LLPOtVksAzkmmjNUoMWqVu0CXzUJyt12MlpF6cE.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/kPtXTS2_-hE543snBf9Lq9WAF0Ndqx13adwhA4t9ocA.original.fullsize.png)
20220112 1:21:00

![](https://cdn.mathpix.com/snip/images/rTXpQU51atQs99s9EwPqGqrm_BTcVwMeu8ZtSh5bhHw.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/PA22YvmpwB85zzS4lZNDcqSHyf6d5W_NTQyhAZYiUQU.original.fullsize.png)

![](https://cdn.mathpix.com/snip/images/VHHcpVuPfNCOOnoEFCag82Y0cFe8Ouu_PRV66-vhuXY.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/PuRL_kTbpOSy8F4ibb20jBtcUi6sAugZJMZG7BzZhA0.original.fullsize.png)

![](https://cdn.mathpix.com/snip/images/5rc9l9amFL4PhVNWmRyXk27DbioI_ifVl7IzVnwWc38.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/x-OPoomX9J_-JuVaGUUtyCavZdyDvi5KWldXSWrlKrw.original.fullsize.png)

20220112 1:29:00

#### Cociente entre varianzas de dos muestras independientes

![](https://cdn.mathpix.com/snip/images/kfLfGHlkFZ_mbcYWxQAjO66dFfC9QABYSUx0u-OCvsw.original.fullsize.png)

![](https://cdn.mathpix.com/snip/images/_zX2Lgefe8S_70-U9xMsBoOv0jiw4-XJ7v-nQiIAhoU.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/39RywT_0lNJ40OPuUjyThC4BVCav2TR2GYvL1D46YlE.original.fullsize.png)
20220112 1:38:00


#### **Diferencia de proporciones en muestras independientes**
![](https://cdn.mathpix.com/snip/images/ycw5KyfT6Am4i8D5bYFk-zPB-Py5QTDYdK4DajqlEPk.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/HFt1wgWPrxecA45JyTvgzUGgvCFnxCzf0k6cF8Q1qEE.original.fullsize.png)


### **Tamaño de muestra para medias**

![](https://cdn.mathpix.com/snip/images/dXzQpHuzV_kw2qMl5ZDOv38LUBG20vvgeqZhdAgwgSs.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/HrUVanj5mjX02yusQeiMDgpKWDqSB1juIR5DAikVgMg.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/SNvoeB2_ziRVqq0uCmSK2GOBELDzZV0VAEJ3qctXisU.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/eLw1B4rqDKMeK78LX0H0D-tncelcjR6DyfCW4KY4BuI.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/K9OgZX_E-HpDYSoqNGbo5L4C5rqzrK3gEzwKUOYtVJA.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/7LatezvetFuAkk9r33Ja4JYuhi3rzUoeGOJtulYOApc.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/dehpAM_d-QsME-vPeY3qEONN3cRK-6pu9S8k_m2SQcU.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/m7U207GsnXR93hmZ4v6tX54S09d6ClVOWR010NWFRuA.original.fullsize.png)


### **Intervalos unilaterales**

![](https://cdn.mathpix.com/snip/images/CR-0ezyz20rnlenUkCFvZrRUrdXMaiv-yFy-sc6hn7Y.original.fullsize.png)
![](https://cdn.mathpix.com/snip/images/qbNJpNTuRmIksUDgLtJzrxszExgWQwrm6xVcL8Fk8lA.original.fullsize.png)
