# **MONTE CARLO EN [0,1]**

Perfecto, lo resolvemos **a mano** paso a paso usando Monte Carlo.

---

## **1. Planteamiento del problema**

Queremos aproximar:

$$
\theta = \int_0^1 e^{e^x} \, dx
$$

Usando el método de Monte Carlo, interpretamos la integral como:

$$
\theta = E\big[ g(U) \big], \quad U \sim \text{Uniform}(0,1), \quad g(u) = e^{e^u}
$$

La idea es generar $n$ valores $U_i$ uniformes en $(0,1)$ y estimar:

$$
\hat{\theta}_n = \frac{1}{n} \sum_{i=1}^n g(U_i)
$$

---

## **2. Datos proporcionados**

Números pseudoaleatorios $U_i$:

$$
0.7284,\quad 0.1539,\quad 0.5872,\quad 0.9126,\quad 0.3467
$$

Tenemos $n = 5$.

---

## **3. Evaluación de $g(u) = e^{e^u}$**

Calculemos cada término a mano (usando 4 decimales intermedios):

1. **Para** $u_1 = 0.7284$
   $e^{u_1} \approx e^{0.7284} \approx 2.0715$
   $g(u_1) \approx e^{2.0715} \approx 7.9399$

2. **Para** $u_2 = 0.1539$
   $e^{u_2} \approx e^{0.1539} \approx 1.1664$
   $g(u_2) \approx e^{1.1664} \approx 3.2109$

3. **Para** $u_3 = 0.5872$
   $e^{u_3} \approx e^{0.5872} \approx 1.7991$
   $g(u_3) \approx e^{1.7991} \approx 6.0424$

4. **Para** $u_4 = 0.9126$
   $e^{u_4} \approx e^{0.9126} \approx 2.4909$
   $g(u_4) \approx e^{2.4909} \approx 12.0731$

5. **Para** $u_5 = 0.3467$
   $e^{u_5} \approx e^{0.3467} \approx 1.4142$
   $g(u_5) \approx e^{1.4142} \approx 4.1132$

---

## **4. Promedio muestral**

Sumamos los valores:

$$
S = 7.9399 + 3.2109 + 6.0424 + 12.0731 + 4.1132 \approx 33.3795
$$

Calculamos la estimación:

$$
\hat{\theta}_5 = \frac{33.3795}{5} \approx 6.6759
$$

---

## **5. Interpretación**

* **Estimación Monte Carlo:** $\theta \approx 6.6759$ usando 5 puntos.
* Esto es una aproximación con alta variabilidad por el tamaño de muestra pequeño.
* Si aumentamos $n$, la **Ley de los Grandes Números** asegura que $\hat{\theta}_n \to \theta$.
* El **error estándar** se reduciría como $\sigma / \sqrt{n}$.

---

Si quieres, puedo ahora **calcular también la varianza muestral** y darte el **intervalo de confianza al 95%** para que sea un ejemplo de examen completo. ¿Quieres que lo haga?


Perfecto, sigamos con el cálculo estadístico completo.

---

## **1. Datos**

Valores de $g(U)$ calculados antes:

$$
g_1 = 7.9399, \quad
g_2 = 3.2109, \quad
g_3 = 6.0424, \quad
g_4 = 12.0731, \quad
g_5 = 4.1132
$$

Media muestral:

$$
\bar{g} = \hat{\theta}_5 \approx 6.6759
$$

---

## **2. Varianza muestral**

La fórmula de la **varianza muestral** (no sesgada) es:

$$
s^2 = \frac{1}{n-1} \sum_{i=1}^n (g_i - \bar{g})^2
$$

Calculamos cada desviación al cuadrado:

1. $(7.9399 - 6.6759)^2 \approx (1.2640)^2 \approx 1.5977$
2. $(3.2109 - 6.6759)^2 \approx (-3.4650)^2 \approx 12.0031$
3. $(6.0424 - 6.6759)^2 \approx (-0.6335)^2 \approx 0.4013$
4. $(12.0731 - 6.6759)^2 \approx (5.3972)^2 \approx 29.1440$
5. $(4.1132 - 6.6759)^2 \approx (-2.5627)^2 \approx 6.5683$

Suma:

$$
\Sigma \approx 1.5977 + 12.0031 + 0.4013 + 29.1440 + 6.5683 \approx 49.7144
$$

Dividimos entre $n-1 = 4$:

$$
s^2 \approx \frac{49.7144}{4} \approx 12.4286
$$

Por lo tanto:

$$
s \approx \sqrt{12.4286} \approx 3.5254
$$

---

## **3. Error estándar**

El error estándar del estimador Monte Carlo es:

$$
\text{SE} = \frac{s}{\sqrt{n}} \approx \frac{3.5254}{\sqrt{5}} \approx \frac{3.5254}{2.2361} \approx 1.5764
$$

---

## **4. Intervalo de confianza al 95%**

Usamos la distribución t de Student con $n-1 = 4$ grados de libertad:

$$
t_{0.975,4} \approx 2.776
$$

El intervalo es:

$$
\bar{g} \pm t \cdot \text{SE} \quad \Rightarrow \quad
6.6759 \pm 2.776 \times 1.5764
$$

Margen de error:

$$
ME \approx 2.776 \times 1.5764 \approx 4.3778
$$

---

**Resultado final:**

$$
IC_{95\%} \approx (6.6759 - 4.3778, \; 6.6759 + 4.3778) \approx (2.2981, \; 11.0537)
$$

---

## **5. Interpretación formal**

* El intervalo $(2.30, 11.05)$ **no significa** que la probabilidad de que $\theta$ esté ahí sea 95%, sino que **si repitiéramos el experimento muchas veces**, el 95% de esos intervalos contendrían el valor real $\theta$.
* El **error estándar** ($\approx 1.5764$) cuantifica la dispersión esperada del estimador $\hat{\theta}_n$ alrededor de $\theta$ para muestras de tamaño 5.
* El intervalo es **muy ancho** porque $n=5$ es muy pequeño y la función $e^{e^x}$ crece rápidamente, generando alta varianza.

---

Si quieres, puedo ahora **hacer una visualización** que muestre cómo este intervalo de confianza se va estrechando conforme aumentamos $n$ usando Monte Carlo interactivo. ¿Quieres que lo arme?


# **t student**

Se usa la **t de Student** y no directamente la normal por una razón clave:

---

## 1️⃣ Contexto

Cuando aplicamos la fórmula del intervalo de confianza para una media:

$$
\bar{x} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}}
$$

* $z_{\alpha/2}$ viene de la distribución normal estándar.
* Esto **solo es válido** si conocemos la desviación estándar poblacional $\sigma$.

En Monte Carlo, igual que en la mayoría de aplicaciones reales, **no conocemos $\sigma$**:

* Tenemos que estimarla con la **desviación estándar muestral** $s$.
* Esto introduce **incertidumbre extra** en el estimador, especialmente cuando $n$ es pequeño.

---

## 2️⃣ Por qué entra la t-Student

William Sealy Gosset (bajo el pseudónimo "Student") demostró que:

Si $X_1, \dots, X_n$ son i.i.d. normales con media $\mu$ y desviación estándar $\sigma$ desconocida, entonces:

$$
T = \frac{\bar{X} - \mu}{s / \sqrt{n}} \quad \text{sigue una distribución t de Student con } n-1 \text{ grados de libertad.}
$$

🔹 La **t-Student** es más "gorda" en las colas que la normal.
🔹 Esto compensa el hecho de que **usar $s$** en vez de $\sigma$ genera más variabilidad.

---

## 3️⃣ Regla práctica

* **n grande** (ej. $n > 30$): la t se aproxima a la normal y se puede usar $z$.
* **n pequeño** y $\sigma$ desconocida: usar $t$ con $n-1$ grados de libertad.

En tu ejercicio:

* $n = 5$ → muy pequeño.
* $\sigma$ no conocida → usamos $s$ y por tanto **t-Student**.

---

## 4️⃣ Interpretación

En tu intervalo $(2.30, 11.05)$, el factor $t_{0.975,4} \approx 2.776$ es **más grande** que el equivalente normal $z_{0.975} \approx 1.96$.
Esto **ensancha el intervalo** para reflejar la mayor incertidumbre en la estimación de la varianza.

---

Si quieres, puedo **mostrarte con un gráfico** cómo varía el factor crítico cuando pasamos de $n=5$ a $n=30$, y cómo el intervalo de confianza se encoge. ¿Quieres que lo haga?


Aquí tienes una guía sintética pero estructurada sobre **cuándo usar distintas distribuciones** en estadística inferencial, pensando en casos como estimación, pruebas de hipótesis y construcción de intervalos de confianza.

---

## 1️⃣ Normal estándar $N(0,1)$

* **Se usa cuando:**

  * La variable poblacional es normal **y** la desviación estándar $\sigma$ es conocida.
  * O bien, $n$ es grande ($n > 30$), $\sigma$ desconocida pero reemplazada por $s$, aplicando aproximación asintótica (Teorema Central del Límite).
* **Aplicaciones típicas:**

  * Intervalos de confianza para medias con $\sigma$ conocida.
  * Pruebas z para medias o proporciones.

---

## 2️⃣ t de Student

* **Se usa cuando:**

  * La población es normal (o $n$ no muy grande) y $\sigma$ es desconocida.
  * Intervalos de confianza y pruebas de hipótesis sobre medias.
* **Regla clave:**

  * Grados de libertad $\text{gl} = n - 1$.
  * Para $n$ grande, t → normal estándar.
* **Aplicaciones:**

  * Intervalos para media con varianza desconocida y $n$ pequeño.
  * Pruebas t de una muestra, dos muestras independientes o apareadas.

---

## 3️⃣ Chi-cuadrado $\chi^2$

* **Se usa cuando:**

  * Se trabaja con varianzas y desviaciones estándar.
  * Se modelan variables que son suma de cuadrados de normales estándar.
* **Aplicaciones:**

  * Intervalos de confianza para la varianza.
  * Pruebas de bondad de ajuste.
  * Pruebas de independencia en tablas de contingencia.

---

## 4️⃣ F de Fisher-Snedecor

* **Se usa cuando:**

  * Se comparan **varianzas** de dos poblaciones.
  * Es el cociente de dos variables $\chi^2$ escaladas por sus grados de libertad.
* **Aplicaciones:**

  * ANOVA (análisis de varianza).
  * Pruebas de homogeneidad de varianzas.

---

## 5️⃣ Distribuciones no centrales y casos especiales

* **Distribución normal no central:** aparece en pruebas de hipótesis con medias desplazadas.
* **t no central:** en potencias de prueba para t-tests.
* **F no central:** en ANOVA cuando la hipótesis nula es falsa.

---

💡 **Resumen práctico de decisión:**

1. **¿Estimamos una media?**

   * $\sigma$ conocida → Normal.
   * $\sigma$ desconocida:

     * $n$ pequeño → t-Student.
     * $n$ grande → Normal (aproximación).
2. **¿Estimamos una varianza?** → Chi-cuadrado.
3. **¿Comparamos dos varianzas?** → F de Fisher.
4. **¿Comparamos varias medias?** → F de Fisher (ANOVA).

---

Si quieres, puedo hacerte **un diagrama de flujo** con estas decisiones para que lo tengas visual y listo para examen. ¿Quieres que te lo haga?
