In [35]:
from itertools import product

---
# Ejercicio 8
Sean $X1,...,Xn$ variables aleatorias independientes e idénticamente distribuidas con varianza $\sigma²$ desconocida. Se planea estimar $\sigma^2$ mediante la varianza muestral
$$ S² =  \sum_{i=1}^n \frac{(X_i - \overline{X})²}{(n-1)}$$

a) Si $n = 2, X_1 = 1 \text{ y } X_2 = 3$, ¿cuál es la estimación “bootstrap” de $Var(S^2)$?

Se han obtenido dos muestras de una variable X con distribución F según el ejercicio.

Luego la distribución empírica $F_e$ asigna a X la probabilidad:
$$
p_i = P(X = x_i) = \frac{\# \{j| x_j = x_i\}}{n} 
$$ 

tal que para nuestro caso:
$$
P_{F_e}(X = x_1) = 0.5 \quad P_{F_e}(X = x_2) = 0.5
$$

Así tenemos que una muestra *bootstrap* de tamaño $n^n=2^2=4$, para estimar la varianza, tomada de esta distribución empírica es:
$$
b_1 = (1, 1), \quad b_2 = (1, 3), \quad, b_3 = (3, 1), \quad b_4 = (3, 3)
$$

A su vez debemos tener en cuenta que como se quiere hallar $Var(S²) \Rightarrow \widehat{\theta} = S²$

Y se calculan las 4 *replicaciones bootstrap* correspondientes:
$$
\begin{align*}
    \overline{X}_{b_1}  &= \theta(1, 1) = \frac{1 + 1}{2} = 1\\[0.3cm]
    \overline{X}_{b_2}  &= \theta(1, 3) = \frac{1 + 3}{2} = 2\\[0.3cm]
    \overline{X}_{b_3}  &= \theta(3, 1) = \frac{3 + 1}{2} = 2\\[0.3cm]
    \overline{X}_{b_4}  &= \theta(3, 3) = \frac{3 + 3}{2} = 3\\[0.3cm]
\end{align*}
$$

<br>

$$
\begin{align*}
    \widehat{\theta}_{b_1}  &= S_{b_1}^2 = \frac{1}{2-1}\cdot \sum_{i=1}^2 (b_{j_i} - \overline{X}_{b_1})^2 =
    
    \frac{(1-1)^2 + (1-1)^2}{2-1} = 0\\[0.3cm]
    \widehat{\theta}_{b_2}  &= S_{b_2}^2 = \frac{1}{2-1}\cdot \sum_{i=1}^2 (b_{j_i} - \overline{X}_{b_2})^2 =
    
    \frac{(1-2)^2 + (3-2)^2}{2-1} = 2\\[0.3cm]
    \widehat{\theta}_{b_3}  &= S_{b_3}^2 = \frac{1}{2-1}\cdot \sum_{i=1}^2 (b_{j_i} - \overline{X}_{b_3})^2 =
    
    \frac{(3-2)^2 + (1-2)^2}{2-1} = 2\\[0.3cm]
    \widehat{\theta}_{b_4}  &= S_{b_4}^2 = \frac{1}{2-1}\cdot \sum_{i=1}^2 (b_{j_i} - \overline{X}_{b_4})^2 =
    
    \frac{(3-3)^2 + (3-3)^2}{2-1} = 0\\[0.3cm]
\end{align*}
$$

Por último como $Var(S²) = Var(\widehat{\theta}) = E[\widehat{\theta}²] - E[\widehat{\theta}]²$
$$
E[\widehat{\theta}] = \frac{0+2+2+0}{4} = 1\\[0.3cm]
$$

Luego:
$$
Var(\widehat{\theta}) = \frac{1}{4-1} \sum_{i=1}^4 (\widehat{\theta}_{b_i} - E[\widehat{\theta}])² =
 \frac{(0-1)² + (2-1)² + (2-1)² + (0-1)²}{4-1} = 1.3333\ldots
$$



In [47]:
def X_bar(XiS:tuple[int, ...] | list[int | float]) -> float:
    """
    Cálculo de la media de una tupla o una lista

    Args:
        XiS (tuple[int, ...] | list[int | float] ): Tupla de muestra bootstrap ó lista de muestras bootstrap
    """
    return sum(XiS) / len(XiS)

def S_squared(XiS: tuple[int, ...] | list[float]) -> float:
    """
    Varianza muestral (S²) de una tupla

    Args:
        XiS (tuple[int, ...]): Tupla de muestra bootstrap

    Returns:
        float: Varianza muestral S²
    """
    n = len(XiS)
    if n < 2:
        raise ValueError("La varianza requiere al menos 2 elementos.")
    
    mean = sum(XiS) / n
    return sum((x - mean) ** 2 for x in XiS) / (n - 1)

def bootstrap_estimation(real_values: list[int]):
    
    bootstrap_samples = list(product(real_values, repeat=len(real_values))) 

    X_bar_i = [X_bar(sample) for sample in bootstrap_samples]

    widehat_theta_i = [S_squared(sample) for sample in bootstrap_samples]
    
    return S_squared(XiS=widehat_theta_i)
    

In [46]:
REAL_VALUES = [1, 3]
estimation = bootstrap_estimation(real_values=REAL_VALUES)
print(f"🧮 Estimación de Var(S²): {estimation:.4f}")

🧮 Estimación de Var(S²): 1.3333
