5. En general la varianza de estimadores es no calculable:
   $$ V(\theta) = E(\theta^2)-E(\theta)^2$$

En el caso de la distribución exponencial tenemos un valor analítico dado por:
$$\begin{align*}
V(\hat{\theta}) &= \int_{0}^{\infty} \dots \int_{0}^{\infty} \left(\frac{1}{n} \cdot \sum_{i = 1}^{n} x_{i} \right)^{2} \cdot \frac{1}{\theta} e^{-x_{1}/\theta} \dots \frac{1}{\theta} \cdot e^{-x_{n}/\theta} dx_{1} \cdots dx_{n} - \left[ \int_{0}^{\infty} \dots \int_{0}^{\infty} \left(\frac{1}{n} \cdot \sum_{i = 1}^{n} x_{i} \right) \cdot \frac{1}{\theta} e^{-x_{1}/\theta} \dots \frac{1}{\theta} \cdot e^{-x_{n}/\theta} dx_{1} \cdots dx_{n} \right]^{2} \\&= \frac{\theta^{2}}{n}.
\end{align*}$$

Permitámonos avanzar paso a paso para encontrar la varianza del estimador para la distribución exponencial.
Se nos da una muestra aleatoria $X_1, X_2, \dots, X_n$ de una distribución exponencial con parámetro $\theta$. El estimador de máxima verosimilitud (MLE) para $\theta$ está dado por la media muestral:

$$\hat{\theta} = \frac{1}{n} \sum_{i=1}^n X_i$$

Ahora, nosotros queremos encontrar la varianza de este estimador, el cual viene dado por:

$$V(\hat{\theta}) = E(\hat{\theta}^2) - E(\hat{\theta})^2$$

Primero, encontremos $E(\hat{\theta})$. Desde que $\hat{\theta}$ es la media muestral, nosotros sabemos que:

$$E(\hat{\theta}) = E\left(\frac{1}{n} \sum_{i=1}^n X_i\right) = \frac{1}{n} \sum_{i=1}^n E(X_i)$$

Para una distribución exponencial, $E(X_i) = \theta$. Por lo tanto:

$$E(\hat{\theta}) = \frac{1}{n} \sum_{i=1}^n \theta = \frac{1}{n} \cdot n \theta = \theta$$

Ahora, encontremos $E(\hat{\theta}^2)$:

$$E(\hat{\theta}^2) = E\left(\frac{1}{n^2} \left(\sum_{i=1}^n X_i\right)^2\right)$$

Expandiendo el cuadrado, obtenemos:

$$E(\hat{\theta}^2) = \frac{1}{n^2} E\left(\sum_{i=1}^n X_i^2 + 2\sum_{i=1}^n \sum_{j=i+1}^n X_i X_j\right)$$

Ahora podemos encontrar las expectativas por separado:

$$E\left(\sum_{i=1}^n X_i^2\right) = \sum_{i=1}^n E(X_i^2) = nE(X^2)$$

Para una distribución exponencial, $E(X^2) = 2\theta^2$. Por lo tanto:

$$E\left(\sum_{i=1}^n X_i^2\right) = n(2\theta^2) = 2n\theta^2$$

Ahora, encontremos la expectativa de los términos cruzados:

$$E\left(\sum_{i=1}^n \sum_{j=i+1}^n X_i X_j\right) = \sum_{i=1}^n \sum_{j=i+1}^n E(X_i X_j)$$

Ya que $X_i$ y $X_j$ son independientes, $E(X_i X_j) = E(X_i)E(X_j) = \theta^2$. Hay $\frac{n(n-1)}{2}$ como terminos, entonces:

$$E\left(\sum_{i=1}^n \sum_{j=i+1}^n X_i X_j\right) = \frac{n(n-1)}{2} \theta^2$$

Ahora podemos hallar $E(\hat{\theta}^2)$:

$$E(\hat{\theta}^2) = \frac{1}{n^2}\left(2n\theta^2 + n(n-1)\theta^2\right) = \frac{2n\theta^2 + n^2\theta^2 - n\theta^2}{n^2} = \frac{n\theta^2}{n} = \frac{\theta^2}{n}$$

Finalmente, podemos encontrar la varianza del estimador:

$$V(\hat{\theta}) = E(\hat{\theta}^2) - E(\hat{\theta})^2 = \frac{\theta^2}{n} - \theta^2 = \frac{\theta^2}{n}$$

In [2]:
import numpy as np
from tqdm import tqdm

In [4]:
N=int(1e6)
theta=2
n=20
Points=np.zeros([N,n])

In [5]:
for i in tqdm(range(N)):   
   Points[i]=(np.random.exponential(theta,n))

100%|██████████| 1000000/1000000 [00:04<00:00, 248327.01it/s]


In [6]:
Promedio=np.mean(Points,axis=1)

In [7]:
Var_estimada=np.var(Promedio,ddof=1)

In [9]:
print(Var_estimada,theta**2/n)

0.19960869494836586 0.2
