<a href="https://colab.research.google.com/github/abxda/Aurora_s1_estdesc/blob/main/Semana_3_Aurora_EstDesc.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## 1. Introducción a la Inferencia Estadística

La **inferencia estadística** es el proceso de utilizar datos de una **muestra** para hacer generalizaciones o inferencias sobre la **población** de la cual se obtuvo la muestra.

En sistemas de control y medición, la inferencia estadística es esencial para:

* **Estimar parámetros desconocidos:** Por ejemplo, la cantidad promedio de pedidos recibidos en una cadena logística o el porcentaje de productos defectuosos en un proceso de fabricación.
* **Tomar decisiones basadas en datos:** Por ejemplo, determinar si un nuevo sistema de gestión de inventario está mejorando el rendimiento o si se necesitan ajustes en un proceso de producción para cumplir con los estándares de calidad.

**Conceptos clave:**

* **Población:** Conjunto completo de elementos o individuos que son de interés para un estudio.
* **Muestra:** Subconjunto de la población que se selecciona para el estudio.
* **Parámetro:** Valor numérico que describe una característica de la población (generalmente desconocido).
* **Estimador:** Valor numérico calculado a partir de una muestra que se utiliza para estimar un parámetro poblacional.

## 2. Intervalos de Confianza

Un **intervalo de confianza** es un rango estimado de valores que se obtiene a partir de una *muestra de datos*. Este intervalo se construye con el propósito de indicar, con un *nivel específico de probabilidad*, dónde se espera que se encuentre el verdadero valor de un **parámetro poblacional desconocido**. Por ejemplo, podríamos decir que estamos *95% seguros* de que la estatura promedio de todos los adultos en un país está entre 170 y 175 cm, basándonos en mediciones de una muestra de 1000 adultos seleccionados al azar. Este rango de 170 a 175 cm sería nuestro **intervalo de confianza**, y el 95% representa nuestro **nivel de confianza** en que el verdadero promedio poblacional se encuentra dentro de ese intervalo.

**Interpretación del intervalo de confianza:**

La interpretación correcta de un intervalo de confianza se basa en la repetición hipotética del proceso de muestreo. Si construyéramos múltiples intervalos de confianza del 95% para la estatura promedio de los adultos en un país, cada uno basado en diferentes muestras de 1000 personas, esperaríamos que aproximadamente el 95% de estos intervalos contuvieran el **verdadero valor de la estatura promedio** de la población. Por ejemplo, si realizáramos este proceso 100 veces, aproximadamente 95 de los intervalos resultantes incluirían la *estatura promedio real* de todos los adultos del país. Es importante destacar que cualquier intervalo individual tiene una probabilidad del 95% de contener el verdadero valor, pero no podemos estar seguros de si un intervalo específico es uno de los que lo contiene o no.

**Nivel de confianza:**

El nivel de confianza, comúnmente representado como (1-α), es un concepto fundamental en la construcción de intervalos de confianza. Este valor indica la *probabilidad* de que el intervalo calculado contenga el **verdadero valor del parámetro poblacional**. Se expresa típicamente como un porcentaje, siendo los más comunes 90%, 95% y 99%. Por ejemplo, en nuestro caso de la estatura promedio, un nivel de confianza del 95% significa que estamos utilizando un método que, a largo plazo, producirá intervalos que contienen el verdadero promedio poblacional en el 95% de los casos.

Es importante entender que existe una relación inversa entre la amplitud del intervalo y el nivel de confianza. Un *mayor nivel de confianza* implica un *intervalo más amplio*. Por ejemplo, un intervalo de confianza del 99% para la estatura promedio sería más amplio que uno del 95%, quizás extendiéndose de 169 a 176 cm en lugar de 170 a 175 cm. Esto refleja el compromiso entre la confianza en nuestras estimaciones y la precisión de las mismas.

**Valor crítico en intervalos de confianza:**

El *valor crítico*, comúnmente representado como Z o t, es un componente esencial en la construcción de intervalos de confianza. Este valor está **directamente relacionado con el nivel de confianza** que hemos elegido y la *distribución de probabilidad* que sigue nuestra estadística muestral.

En el contexto de nuestro ejemplo sobre la estatura promedio, el valor crítico nos ayuda a determinar *qué tan lejos* debemos extender nuestro intervalo desde la media muestral para alcanzar el nivel de confianza deseado. Por ejemplo, para un nivel de confianza del 95% y asumiendo una distribución normal, utilizaríamos un valor Z de aproximadamente 1.96.

La elección entre usar Z o t depende principalmente del *tamaño de la muestra* y de si conocemos la **desviación estándar poblacional**:

- Usamos Z cuando la muestra es grande (generalmente n > 30) o cuando conocemos la desviación estándar poblacional.
- Optamos por t cuando la muestra es pequeña y desconocemos la desviación estándar poblacional.

En la práctica, estos valores se obtienen de tablas estadísticas o, más comúnmente, mediante funciones en software estadístico. Por ejemplo, si aumentáramos nuestro nivel de confianza al 99% para el intervalo de la estatura promedio, nuestro valor crítico Z cambiaría a aproximadamente 2.58, resultando en un intervalo más amplio.

Es crucial entender que el valor crítico *no es arbitrario*, sino que se deriva matemáticamente para asegurar que el intervalo resultante tenga exactamente la probabilidad deseada de contener el verdadero parámetro poblacional.

**Pruebas de una cola y dos colas:**

En el contexto de los intervalos de confianza y las pruebas de hipótesis, es importante entender la diferencia entre las pruebas de una cola y dos colas:

1. **Prueba de una cola:** En este tipo de prueba, estamos interesados en si un parámetro poblacional es mayor o menor que un valor específico, pero no en ambas direcciones simultáneamente. Por ejemplo, podríamos querer saber si la estatura promedio de los adultos en un país es mayor que 170 cm, sin preocuparnos si es menor.

2. **Prueba de dos colas:** En una prueba de dos colas, estamos interesados en cualquier desviación del valor hipotético, ya sea por encima o por debajo. Por ejemplo, podríamos querer saber si la estatura promedio de los adultos en un país es diferente de 170 cm, sin especificar si esperamos que sea mayor o menor.

La elección entre una prueba de una cola o dos colas afecta cómo se distribuye el nivel de significancia (α) y, por lo tanto, cómo se calculan los valores críticos:

- En una prueba de una cola con un nivel de confianza del 95%, todo el 5% de la región crítica se encuentra en un extremo de la distribución.
- En una prueba de dos colas con un nivel de confianza del 95%, el 5% de la región crítica se divide equitativamente entre ambos extremos de la distribución (2.5% en cada cola).

Esta distinción es crucial al usar funciones como `norm.ppf` para calcular valores críticos, ya que afecta directamente los argumentos que se pasan a la función.

**Uso de norm.ppf en la estimación de intervalos de confianza:**

La función `norm.ppf` de `scipy.stats` es una herramienta valiosa para calcular los valores críticos en la construcción de intervalos de confianza. Esta función toma un porcentaje y devuelve un multiplicador de desviación estándar para ese valor en la distribución normal. Por ejemplo, `norm.ppf(0.95, loc=0, scale=1)` devuelve un valor que marca dónde se encuentra el 95% de los puntos de datos en una prueba de una cola en una distribución normal estándar.

En un ejemplo práctico, para calcular el valor en el que se encuentra nuestro intervalo de significancia del 95% (para una prueba de una cola), usaríamos `norm.ppf(0.95, loc=172.7815, scale=4.1532)`. Este valor marca dónde se encontrarían el 95% de los puntos de datos si nuestros datos siguen una distribución normal.

Para una prueba de dos colas, debemos dividir el nivel de significancia entre ambas colas. Para un nivel de significancia del 95%, esto implicaría usar `norm.ppf(0.975, loc=172.7815, scale=4.1532)`, ya que estamos interesados en los valores en ambos extremos de nuestra media.

**Aclaración sobre loc y scale:**

En el contexto de `norm.ppf` y la construcción de intervalos de confianza:

- `loc` representa la media. En nuestro ejemplo, 172.7815 es la media muestral, no la poblacional. Usamos la media muestral porque generalmente no conocemos la verdadera media poblacional (que es lo que estamos tratando de estimar).

- `scale` representa la desviación estándar. El valor 4.1532 en nuestro ejemplo es la desviación estándar muestral. Si conociéramos la desviación estándar poblacional, la usaríamos aquí. Sin embargo, en la mayoría de los casos prácticos, solo tenemos acceso a la desviación estándar muestral.

Es importante notar que al usar la desviación estándar muestral en lugar de la poblacional, especialmente para muestras pequeñas, deberíamos considerar usar la distribución t de Student en lugar de la distribución normal. Sin embargo, para muestras grandes (generalmente n > 30), la distribución normal es una buena aproximación.

El uso de estos valores muestrales en lugar de los poblacionales refleja la realidad de la inferencia estadística: estamos utilizando información de una muestra para hacer estimaciones sobre una población. Esta es la esencia de por qué construimos intervalos de confianza en primer lugar - para cuantificar la incertidumbre en nuestras estimaciones debido a la variabilidad muestral.

Finalmente, el margen de error en la estimación de un parámetro poblacional se puede calcular utilizando el valor devuelto por `norm.ppf` multiplicado por la desviación estándar de nuestra distribución. Por ejemplo:





# 📊 Visualizador de Valores Críticos (Z y t) y Estadístico de Prueba

Este interactivo te ayudará a comprender los **valores críticos** en estadística y cómo se relacionan con un **estadístico de prueba**.

### Conceptos Clave:

*   **Nivel de Confianza:** La probabilidad de que un intervalo de confianza contenga el verdadero parámetro poblacional. Un nivel de confianza del 95% significa que estamos 95% seguros de que el intervalo contiene el verdadero parámetro.
*   **Nivel de Significación (α):** Es `1 - Nivel de Confianza`. Representa la probabilidad de cometer un error de Tipo I (rechazar una hipótesis nula verdadera). Las regiones sombreadas en rojo representan α.
*   **Región de Aceptación (Verde):** El área de la distribución donde, si tu estadístico de prueba cae, **no hay suficiente evidencia** para rechazar la hipótesis nula. Corresponde al nivel de confianza.
*   **Región de Rechazo (Roja):** El área de la distribución donde, si tu estadístico de prueba cae, **hay suficiente evidencia** para rechazar la hipótesis nula. Corresponde al nivel de significación (α).

*   **Distribución Z (Normal Estándar):** Se usa cuando la muestra es grande (`n > 30`) o se conoce la desviación estándar poblacional. Su media es 0 y su desviación estándar es 1.
*   **Distribución t de Student:** Se usa cuando la muestra es pequeña y se desconoce la desviación estándar poblacional. Su forma depende de los **grados de libertad (df = n - 1)**. A medida que `n` aumenta, la distribución t se acerca a la distribución Z.

*   **Prueba de Dos Colas:** Interesada en desviaciones en *ambas* direcciones (mayor o menor que un valor). La región α se divide por igual en ambas colas (`α/2` en cada lado).
*   **Prueba de Una Cola (Superior):** Interesada solo en si el valor es *mayor* que un umbral. Toda la región α está en la cola superior.
*   **Prueba de Una Cola (Inferior):** Interesada solo en si el valor es *menor* que un umbral. Toda la región α está en la cola inferior.

---

### ¿Qué es el Estadístico de Prueba?

El **estadístico de prueba** es un valor numérico calculado a partir de los datos de tu muestra en una prueba de hipótesis. Sirve como una "evidencia" de qué tan lejos está tu resultado muestral del valor hipotetizado bajo la hipótesis nula, en términos de desviaciones estándar (o errores estándar).

**Ejemplos Comunes:**

*   **Para la media (cuando la desviación estándar poblacional es conocida o n es grande):**
    *   $\bar{x}$ es la media muestral.
    *   $\mu_0$ es la media hipotetizada (bajo la hipótesis nula).
    *   $\sigma$ es la desviación estándar poblacional.
    *   $n$ es el tamaño de la muestra.
    
    $$Z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}$$

*   **Para la media (cuando la desviación estándar poblacional es desconocida y n es pequeña):**
    *   $s$ es la desviación estándar muestral.
    
    $$t = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}$$

**Interpretación:**

Una vez que calculas tu estadístico de prueba (Z o t), lo comparas con los **valores críticos**.

*   Si el estadístico de prueba cae dentro de la **Región de Aceptación (verde)**, no rechazas la hipótesis nula. Los datos de tu muestra son consistentes con la hipótesis nula.
*   Si el estadístico de prueba cae dentro de la **Región de Rechazo (rojo)**, rechazas la hipótesis nula. Los datos de tu muestra son demasiado extremos para ser consistentes con la hipótesis nula, lo que sugiere que el verdadero parámetro poblacional es diferente al hipotetizado (o mayor/menor, según el tipo de prueba).

**En este visualizador, puedes manipular los valores que *influirían* en el cálculo del estadístico de prueba ($\mu_0$, $\bar{x}$, $\sigma$ o $s$, $n$) y ver cómo su valor resultante se posiciona en la distribución.**



## 3. Pruebas de Hipótesis

En la **prueba de hipótesis**, se utiliza una muestra de datos para evaluar una afirmación sobre un parámetro poblacional. El proceso se estructura de la siguiente manera:

**Formulación de hipótesis:**

* **Hipótesis nula (H0):** Es la afirmación inicial que se prueba. Usualmente establece que no hay efecto o diferencia significativa. Por ejemplo, puede indicar que la media poblacional es igual a un valor específico.
* **Hipótesis alternativa (H1):** Es la afirmación que se acepta si se rechaza la hipótesis nula. Esta sugiere la presencia de una diferencia o efecto significativo.

La formulación de las hipótesis puede indicar si se trata de una prueba de una cola o de dos colas según cómo se estructuren las hipótesis nula (H0) y alternativa (H1).

1. **Prueba de dos colas:**
   - Se utiliza cuando se quiere detectar cualquier cambio significativo en ambas direcciones (mayor o menor).
   - **Hipótesis nula (H0):** Establece que no hay diferencia o efecto; por ejemplo, $\mu = \mu_0$.
   - **Hipótesis alternativa (H1):** Sugiere que hay una diferencia, sin especificar la dirección; por ejemplo, $\mu \neq \mu_0$.
   - **Indicador clave:** La formulación de H1 utiliza "≠" (diferente), lo que implica que se considera cualquier desviación significativa de $\mu_0$, ya sea hacia arriba o hacia abajo.

2. **Prueba de una cola:**
   - Se utiliza cuando se busca detectar un cambio significativo en una dirección específica.
   - **Hipótesis nula (H0):** Establece que no hay efecto o que el efecto es en una dirección; por ejemplo, $\mu \leq \mu_0$ o $\mu \geq \mu_0$.
   - **Hipótesis alternativa (H1):** Sugiere un efecto en una dirección específica; por ejemplo, $\mu > \mu_0$ o $\mu < \mu_0$.
   - **Indicador clave:** La formulación de H1 incluye una desigualdad direccional ("<" o ">"), lo que implica que se está buscando evidencia de un cambio en una dirección particular.

### Ejemplo:

  **Dos colas:**  
  - **H0:** La media de los tiempos de entrega es igual a 5 días, $\mu = 5$.
  - **H1:** La media de los tiempos de entrega es diferente de 5 días, $\mu \neq 5$.

  **Una cola (superior):**  
  - **H0:** La media de los tiempos de entrega es menor o igual a 5 días, $\mu \leq 5$.
  - **H1:** La media de los tiempos de entrega es mayor a 5 días, $\mu > 5$.

  **Una cola (inferior):**  
  - **H0:** La media de los tiempos de entrega es mayor o igual a 5 días, $\mu \geq 5$.
  - **H1:** La media de los tiempos de entrega es menor a 5 días, $\mu < 5$.

La decisión de utilizar una prueba de una cola o de dos colas depende del contexto de la investigación y de lo que se espera encontrar. Si solo se espera o se desea detectar una desviación en una dirección específica, se utiliza una prueba de una cola. Si se busca detectar cualquier desviación significativa, se utiliza una prueba de dos colas.

**Ejemplo:**
Imaginemos que estamos probando un nuevo medicamento para reducir la presión arterial.
- H0: El medicamento no tiene efecto (la presión arterial media con el medicamento es igual a la presión sin él)
- H1: El medicamento sí tiene efecto (la presión arterial media con el medicamento es diferente a la presión sin él)

## Nivel de Significancia (α)

Imagina que eres un juez en un tribunal. Tu trabajo es decidir si H0 es "inocente" o "culpable".

- **Definición:** Es la probabilidad máxima que estás dispuesto a aceptar de rechazar H0 cuando en realidad es verdadera (cometer un error de tipo I).
- **Valor común:** α = 0.05 (5%)
- **Interpretación:** Si usas α = 0.05, estás diciendo: "Estoy dispuesto a aceptar un 5% de riesgo de equivocarme al rechazar H0 cuando realmente es cierta".

**En nuestro ejemplo:**
α = 0.05 significa que aceptamos un 5% de riesgo de concluir que el medicamento tiene efecto cuando en realidad no lo tiene.

## Valor p

Siguiendo con la analogía del tribunal, el valor p es como la fuerza de la evidencia presentada en contra de H0.

- **Definición:** El valor p es la probabilidad de obtener un resultado al menos tan extremo como el observado en los datos de la muestra, asumiendo que la hipótesis nula (H0) es verdadera.

- **Interpretación intuitiva:**
   - Cuanto más pequeño es el valor p, menos probable es que los datos observados sean consistentes con la hipótesis nula.
   - Cuanto más grande es el valor p, más probable es que los datos observados sean consistentes con la hipótesis nula.
- **Interpretación en términos de distribución:**
   Un valor p grande indica que es más probable que los datos obtenidos en la muestra provengan de una población con las características especificadas en la hipótesis nula.

- **Uso en la toma de decisiones:**
   - Si el valor p es menor que el nivel de significancia (α) preestablecido, se rechaza la hipótesis nula.
   - Si el valor p es mayor que el nivel de significancia (α), no se rechaza la hipótesis nula.

- **Precaución importante:**
   El valor p no mide la probabilidad de que la hipótesis nula sea verdadera. Más bien, mide la probabilidad de obtener datos como los observados (o más extremos) si la hipótesis nula fuera verdadera.

**En nuestro ejemplo:**
- Si obtenemos un valor p = 0.03, significa que hay solo un 3% de probabilidad de ver estos resultados (o más extremos) si el medicamento no tuviera efecto (si H0 fuera cierta).
- Como 0.03 < 0.05 (nuestro α), rechazaríamos H0 y concluiríamos que H1 es probablemente cierta (el medicamento tiene efecto en la presion arterial).

## Tipos de Errores

Imagina que tienes un detector de mentiras para H0. Puede cometer dos tipos de errores:

### Error de Tipo I (Falso Positivo)

- **Definición:** Rechazar H0 cuando en realidad es verdadera.
- **Analogía:** El detector dice que H0 es falsa (el medicamento tiene efecto) cuando en realidad es verdadera (el medicamento no tiene efecto).
- **Probabilidad:** α (nivel de significancia)

### Error de Tipo II (Falso Negativo)

- **Definición:** No rechazar H0 cuando en realidad es falsa.
- **Analogía:** El detector dice que H0 es verdadera (el medicamento no tiene efecto) cuando en realidad es falsa (el medicamento sí tiene efecto).
- **Probabilidad:** β (no confundir con α). β no se fija arbitrariamente como α, sino que se calcula o estima.
Depende de varios factores: el tamaño de la muestra, la magnitud del efecto real, la variabilidad en los datos, y el nivel de significancia (α) elegido.

## Relación entre estos conceptos

1. Empezamos estableciendo H0 y H1 basándonos en nuestra pregunta de investigación.
2. Elegimos un nivel de significancia (α) que determina nuestra tolerancia al Error Tipo I.
3. Recolectamos datos y calculamos el valor p.
4. Comparamos el valor p con α:
   - Si p < α, rechazamos H0 y aceptamos H1, pero nos arriesgamos a un Error Tipo I.
   - Si p > α, no rechazamos H0, pero nos arriesgamos a un Error Tipo II.

**En nuestro ejemplo del medicamento:**
- H0: El medicamento no tiene efecto
- H1: El medicamento sí tiene efecto
- α = 0.05
- Si p = 0.03:
  - Como 0.03 < 0.05, rechazamos H0 y aceptamos H1
  - Concluimos que el medicamento probablemente tiene efecto


### Pruebas de Hipótesis: Explicación Detallada y Ejemplos

#### ¿Qué es una prueba de hipótesis?

Una prueba de hipótesis es un procedimiento estadístico utilizado para tomar decisiones o inferencias sobre un parámetro poblacional basándose en una muestra de datos. La prueba evalúa si la evidencia de la muestra es suficiente para rechazar una hipótesis nula predefinida en favor de una hipótesis alternativa.

#### Contexto Actual: Cadena Logística de Pedidos

En el contexto de la cadena logística de pedidos, podríamos estar interesados en evaluar si la tasa media de pedidos por hora ha cambiado debido a un nuevo sistema de gestión implementado. Supongamos que antes de la implementación, la tasa promedio de pedidos por hora era de 10.

#### Planteamiento de la Prueba de Hipótesis

El planteamiento de una prueba de hipótesis sigue estos pasos:

1. **Definición de las hipótesis**:
   - **Hipótesis nula ($H_0$)**: Es la afirmación que se busca poner a prueba. Generalmente, se plantea como una afirmación de igualdad. En este caso, $H_0$: La tasa media de pedidos por hora es 10.
   - **Hipótesis alternativa ($H_1$)**: Es la afirmación que se considera verdadera si se rechaza la hipótesis nula. Puede ser una afirmación de diferencia o desigualdad. En este caso, $H_1$: La tasa media de pedidos por hora no es 10.

2. **Selección del nivel de significancia ($\alpha$)**: Es la probabilidad de rechazar la hipótesis nula cuando es verdadera. Un valor comúnmente utilizado es $\alpha = 0.05$ (5%).

3. **Recolección de datos**: Se obtiene una muestra representativa de los datos. En nuestro ejemplo, supongamos que recolectamos datos de 50 horas de pedidos después de implementar el nuevo sistema.

4. **Cálculo del estadístico de prueba**: Utilizando la muestra, se calcula un valor que ayudará a determinar si se rechaza o no la hipótesis nula. En el caso de una prueba de hipótesis para la media, este estadístico puede ser una $z$ o $t$.

5. **Determinación del valor p**: El valor p es la probabilidad de observar un resultado tan extremo como el de la muestra, bajo la suposición de que la hipótesis nula es verdadera. Si el valor p es menor que $\alpha$, se rechaza $H_0$.

6. **Decisión**: Basado en el valor p y el nivel de significancia, se decide si se rechaza o no la hipótesis nula.

#### Motivación para Generar una Prueba de Hipótesis

Una prueba de hipótesis se genera cuando existe una necesidad de tomar decisiones informadas sobre un parámetro poblacional basado en datos muestrales. En el contexto de la cadena logística, esto podría ser motivado por varios factores:
- **Evaluar cambios**: Verificar si la implementación de un nuevo sistema de gestión ha alterado significativamente la tasa de pedidos por hora.
- **Validar suposiciones**: Comprobar si las suposiciones operativas actuales (por ejemplo, una tasa de pedidos constante) siguen siendo válidas.
- **Tomar decisiones estratégicas**: Basar decisiones operativas y estratégicas en evidencia estadística sólida, en lugar de intuiciones o suposiciones no verificadas.

#### Beneficios de Realizar una Prueba de Hipótesis

Realizar una prueba de hipótesis proporciona varios beneficios importantes:
- **Rigor estadístico**: Ofrece un marco formal y riguroso para evaluar afirmaciones sobre un parámetro poblacional.
- **Reducción de riesgos**: Ayuda a mitigar el riesgo de tomar decisiones basadas en suposiciones incorrectas o en variaciones aleatorias en los datos.
- **Justificación basada en datos**: Permite justificar decisiones estratégicas y operativas con evidencia cuantitativa, aumentando la credibilidad y confiabilidad de las decisiones tomadas.
- **Identificación de cambios significativos**: Facilita la detección de cambios significativos en los procesos, permitiendo una respuesta oportuna y adecuada a las nuevas condiciones operativas.

Entonces, las pruebas de hipótesis son herramientas fundamentales en el análisis de datos, permitiendo a las organizaciones tomar decisiones informadas y basadas en evidencia, mejorando así la eficiencia y efectividad de sus operaciones.

#Profundicemos en: "Cálculo del estadístico de prueba"

### Pruebas de Hipótesis: Cálculo del Estadístico de Prueba

#### Cálculo del Estadístico de Prueba

4. **Cálculo del estadístico de prueba**: Utilizando la muestra, se calcula un valor que ayudará a determinar si se rechaza o no la hipótesis nula. En el caso de una prueba de hipótesis para la media, este estadístico puede ser una $z$ o $t$.

#### ¿Qué es el estadístico $z$?

El estadístico $z$ se utiliza cuando la muestra es grande (n > 30) y se conoce la desviación estándar de la población ($\sigma$). El estadístico $z$ se calcula utilizando la siguiente fórmula:

$$ z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}} $$

Donde:
- $\bar{x}$ es la media muestral.
- $\mu$ es la media poblacional bajo la hipótesis nula.
- $\sigma$ es la desviación estándar de la población.
- $n$ es el tamaño de la muestra.

El valor $z$ nos indica cuántas desviaciones estándar está la media muestral ($\bar{x}$) de la media poblacional supuesta ($\mu$). Si $|z|$ es grande, esto sugiere que la media muestral está lejos de lo que se esperaría si la hipótesis nula fuera verdadera.

#### ¿Qué es el estadístico $t$?

El estadístico $t$ se utiliza cuando la muestra es pequeña (n ≤ 30) o cuando la desviación estándar de la población ($\sigma$) es desconocida. En este caso, utilizamos la desviación estándar muestral ($s$) en lugar de $\sigma$. El estadístico $t$ se calcula utilizando la siguiente fórmula:

$$ t = \frac{\bar{x} - \mu}{s / \sqrt{n}} $$

Donde:
- $\bar{x}$ es la media muestral.
- $\mu$ es la media poblacional bajo la hipótesis nula.
- $s$ es la desviación estándar muestral.
- $n$ es el tamaño de la muestra.

El valor $t$ es similar al valor $z$ en su interpretación, pero toma en cuenta la variabilidad adicional debida al uso de $s$ en lugar de $\sigma$. Por lo tanto, las distribuciones $t$ tienen colas más gruesas que la distribución normal, lo que refleja la mayor incertidumbre.

#### ¿Cuándo se elige $z$ o $t$?

- Elegir $z$: Se elige el estadístico $z$ cuando la muestra es grande y la desviación estándar de la población es conocida. En estos casos, la distribución de la media muestral se aproxima a una distribución normal.
- Elegir $t$: Se elige el estadístico $t$ cuando la muestra es pequeña o la desviación estándar de la población es desconocida. La distribución $t$ se ajusta mejor a muestras pequeñas y refleja la mayor incertidumbre cuando se estima la desviación estándar a partir de la muestra.

### Interpretación:
- Un valor $z$ de 1 significa que la media muestral está a una desviación estándar de la media poblacional supuesta.
- Un valor $z$ de 2 significa que está a dos desviaciones estándar, y así sucesivamente.
- Cuanto mayor sea $|z|$, más evidencia tenemos contra la hipótesis nula.


****

### De $\alpha$ al Valor Crítico

Para comprender cómo se establece la decisión de rechazar o no una hipótesis nula en una prueba de hipótesis, es fundamental entender los conceptos de $\alpha$ (alfa) y el valor crítico.

### $\alpha$ (alfa):
- Es el **nivel de significancia**, que representa la probabilidad de cometer un error Tipo I, es decir, rechazar la hipótesis nula cuando en realidad es verdadera.
- Comúnmente, se utiliza α = 0.05 o α = 0.01. Un α más pequeño indica una menor probabilidad de cometer un error Tipo I, pero también puede hacer que la prueba sea menos sensible.
- α determina qué tan estrictos somos al decidir rechazar la hipótesis nula. Un nivel de significancia más bajo significa que necesitamos evidencia más fuerte para rechazar la hipótesis nula.

### Valor Crítico:
- Es el punto de corte en la distribución de la estadística de prueba que separa la **región de rechazo** de la **región de no rechazo**.
- Se determina utilizando α y la distribución apropiada (z para distribuciones normales y t para distribuciones t de Student).

### Cómo se Obtiene el Valor Crítico:

1. **Para una prueba de dos colas con α = 0.05**:
   - Dividimos α entre 2 porque hay dos colas: 0.05/2 = 0.025.
   - Buscamos en la tabla z el valor que deja un área de 0.025 en cada cola: z ≈ ±1.96.

2. **Para una prueba de una cola con α = 0.05**:
   - Buscamos en la tabla z el valor que deja un área de 0.05 en una cola: z ≈ 1.645 (para cola derecha).


In [32]:
# IMPORTANTE: EJECUTA TODO ESTE BLOQUE DE CÓDIGO DE UNA SOLA VEZ (Shift + Enter en Jupyter)
# Esto asegura que todos los widgets se definan y configuren correctamente.

import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm, t
import ipywidgets as widgets
from IPython.display import display, Math, HTML

# --- 1. DECLARACIÓN DE TODOS LOS WIDGETS CON SUS VALORES INICIALES Y RANGOS POR DEFECTO ---

# Sliders y Dropdowns para Parámetros de Prueba Estadística
confidence_slider = widgets.FloatSlider(
    value=0.95, min=0.80, max=0.999, step=0.001, description='Confianza:',
    continuous_update=True, orientation='horizontal', readout=True, readout_format='.3f',
)

dist_type_dropdown = widgets.Dropdown(
    options=['Z-distribution (Normal)', 't-distribution'], value='Z-distribution (Normal)',
    description='Distribución:',
)

sample_size_slider = widgets.IntSlider(
    value=30, min=2, max=100, step=1, description='Tamaño de Muestra (n):',
    continuous_update=True, orientation='horizontal', readout=True,
)

test_type_dropdown = widgets.Dropdown(
    options=['Two-tailed', 'One-tailed (Upper)', 'One-tailed (Lower)'], value='Two-tailed',
    description='Tipo de Prueba:',
)

# Inputs para definir los rangos de los sliders REALES
# Estos widgets se declaran y sus valores iniciales son los que se usarán como min/max por defecto.
mean_min_input = widgets.FloatText(
    value=0.0, description='Min Media Real:', readout_format='.1f',
    layout=widgets.Layout(width='auto', flex='1 1 auto')
)
mean_max_input = widgets.FloatText(
    value=200.0, description='Max Media Real:', readout_format='.1f',
    layout=widgets.Layout(width='auto', flex='1 1 auto')
)
std_max_input = widgets.FloatText(
    value=50.0, description='Max Desv. Est. Real:', readout_format='.1f',
    layout=widgets.Layout(width='auto', flex='1 1 auto')
)

# Sliders para valores REALES - Sus rangos se inicializan directamente aquí
# y luego se actualizarán dinámicamente si el usuario cambia los 'min_mean_input' etc.
hypothesized_mean_real_slider = widgets.FloatSlider(
    value=100.0, min=mean_min_input.value, max=mean_max_input.value, step=0.2, description='Media Hipotética (μ₀):',
    continuous_update=True, orientation='horizontal', readout=True, readout_format='.1f',
)

sample_mean_real_slider = widgets.FloatSlider(
    value=100.0, min=mean_min_input.value, max=mean_max_input.value, step=0.2, description='Media Muestral (x̄):',
    continuous_update=True, orientation='horizontal', readout=True, readout_format='.1f',
)

std_dev_real_slider = widgets.FloatSlider(
    value=10.0, min=0.01, max=std_max_input.value, step=0.1, description='Desv. Estándar (σ/s):',
    continuous_update=True, orientation='horizontal', readout=True, readout_format='.1f',
)

# Output Widgets para la fórmula y la regla de decisión
formula_output = widgets.Output()
decision_output = widgets.Output()

# --- 2. DEFINICIÓN DE FUNCIONES ---

def update_plot(confidence_level, dist_type, sample_size, test_type,
                hypothesized_mean_real, sample_mean_real, std_dev_real):
    # Crear una figura con un solo subplot
    fig, ax = plt.subplots(figsize=(10, 6))

    alpha = 1 - confidence_level
    n = sample_size

    # Asegurarse de que std_dev_real no sea cero para evitar división por cero
    if std_dev_real <= 0:
        std_dev_real = 0.001 # Un valor muy pequeño pero no cero

    # Cálculo del Error Estándar (utilizando la desviación estándar en unidades reales)
    if n <= 1:
        standard_error = std_dev_real / 1
    else:
        standard_error = std_dev_real / np.sqrt(n)

    # Cálculo del Estadístico de Prueba (Z o t)
    if standard_error == 0:
        test_statistic = 0.0
    else:
        test_statistic = (sample_mean_real - hypothesized_mean_real) / standard_error

    all_relevant_points = [test_statistic]
    dist_char = "Z" # Carácter para la fórmula y regla de decisión

    # Inicializar variables para valores críticos y decisiones
    cv1, cv2, cv = None, None, None
    decision_text = ""
    decision_color = 'black'

    # --- Configuración y Ploteo de la Gráfica Principal (Z/t estandarizada) ---
    if dist_type == 'Z-distribution (Normal)':
        x_std = np.linspace(-4, 4, 500)
        y_std = norm.pdf(x_std)
        dist_label = "Distribución Normal Estándar (Z)"
        dist_char = "Z"

        # Valor crítico para el intervalo de confianza (SIEMPRE de dos colas para el CI)
        ci_critical_value = norm.ppf(1 - alpha / 2)

        if test_type == 'Two-tailed':
            cv1 = norm.ppf(alpha / 2)
            cv2 = norm.ppf(1 - alpha / 2)

            x_accept = x_std[(x_std > cv1) & (x_std < cv2)]
            y_accept = y_std[(x_std > cv1) & (x_std < cv2)]
            ax.fill_between(x_accept, 0, y_accept, color='lightgreen', alpha=0.4, label=f'Región de Aceptación ({confidence_level*100:.1f}%)')

            x_reject_left = x_std[x_std <= cv1]
            y_reject_left = y_std[x_std <= cv1]
            ax.fill_between(x_reject_left, 0, y_reject_left, color='red', alpha=0.3, label=f'Región de Rechazo (α/2 = {alpha/2:.3f})')

            x_reject_right = x_std[x_std >= cv2]
            y_reject_right = y_std[x_std >= cv2]
            ax.fill_between(x_reject_right, 0, y_reject_right, color='red', alpha=0.3)

            ax.axvline(cv1, color='blue', linestyle='--', label=f'Valor Crítico 1: {cv1:.3f}')
            ax.axvline(cv2, color='blue', linestyle='--', label=f'Valor Crítico 2: {cv2:.3f}')
            ax.text(cv1 - 0.1, 0.02, f'{cv1:.2f}', rotation=90, verticalalignment='bottom', color='blue')
            ax.text(cv2 - 0.1, 0.02, f'{cv2:.2f}', rotation=90, verticalalignment='bottom', color='blue')
            title_suffix = f"Z = {cv1:.2f}, {cv2:.2f}"

            if test_statistic < cv1 or test_statistic > cv2:
                decision_text = "¡RECHAZAR HIPÓTESIS NULA!"
                decision_color = 'red'
            else:
                decision_text = "No rechazar hipótesis nula."
                decision_color = 'darkgreen'

        elif test_type == 'One-tailed (Upper)':
            cv = norm.ppf(1 - alpha)

            x_accept = x_std[x_std < cv]
            y_accept = y_std[x_std < cv]
            ax.fill_between(x_accept, 0, y_accept, color='lightgreen', alpha=0.4, label=f'Región de Aceptación ({confidence_level*100:.1f}%)')

            x_reject = x_std[x_std >= cv]
            y_reject = y_std[x_std >= cv]
            ax.fill_between(x_reject, 0, y_reject, color='red', alpha=0.3, label=f'Región de Rechazo (α = {alpha:.3f})')

            ax.axvline(cv, color='blue', linestyle='--', label=f'Valor Crítico: {cv:.3f}')
            ax.text(cv - 0.1, 0.02, f'{cv:.2f}', rotation=90, verticalalignment='bottom', color='blue')
            title_suffix = f"Z = {cv:.2f}"

            if test_statistic > cv:
                decision_text = "¡RECHAZAR HIPÓTESIS NULA!"
                decision_color = 'red'
            else:
                decision_text = "No rechazar hipótesis nula."
                decision_color = 'darkgreen'

        else: # One-tailed (Lower)
            cv = norm.ppf(alpha)

            x_accept = x_std[x_std > cv]
            y_accept = y_std[x_std > cv]
            ax.fill_between(x_accept, 0, y_accept, color='lightgreen', alpha=0.4, label=f'Región de Aceptación ({confidence_level*100:.1f}%)')

            x_reject = x_std[x_std <= cv]
            y_reject = y_std[x_std <= cv]
            ax.fill_between(x_reject, 0, y_reject, color='red', alpha=0.3, label=f'Región de Rechazo (α = {alpha:.3f})')

            ax.axvline(cv, color='blue', linestyle='--', label=f'Valor Crítico: {cv:.3f}')
            ax.text(cv - 0.1, 0.02, f'{cv:.2f}', rotation=90, verticalalignment='bottom', color='blue')
            title_suffix = f"Z = {cv:.2f}"

            if test_statistic < cv:
                decision_text = "¡RECHAZAR HIPÓTESIS NULA!"
                decision_color = 'red'
            else:
                decision_text = "No rechazar hipótesis nula."
                decision_color = 'darkgreen'

    else: # t-distribution
        df = max(1, sample_size - 1) # Grados de libertad, mínimo 1
        x_std = np.linspace(-4, 4, 500)
        y_std = t.pdf(x_std, df)
        dist_label = f"Distribución t de Student (df = {df})"
        dist_char = "t"

        # Valor crítico para el intervalo de confianza (SIEMPRE de dos colas para el CI)
        ci_critical_value = t.ppf(1 - alpha / 2, df)

        if test_type == 'Two-tailed':
            cv1 = t.ppf(alpha / 2, df)
            cv2 = t.ppf(1 - alpha / 2, df)

            x_accept = x_std[(x_std > cv1) & (x_std < cv2)]
            y_accept = y_std[(x_std > cv1) & (x_std < cv2)]
            ax.fill_between(x_accept, 0, y_accept, color='lightgreen', alpha=0.4, label=f'Región de Aceptación ({confidence_level*100:.1f}%)')

            x_reject_left = x_std[x_std <= cv1]
            y_reject_left = y_std[x_std <= cv1]
            ax.fill_between(x_reject_left, 0, y_reject_left, color='red', alpha=0.3, label=f'Región de Rechazo (α/2 = {alpha/2:.3f})')

            x_reject_right = x_std[x_std >= cv2]
            y_reject_right = y_std[x_std >= cv2]
            ax.fill_between(x_reject_right, 0, y_reject_right, color='red', alpha=0.3)

            ax.axvline(cv1, color='blue', linestyle='--', label=f'Valor Crítico 1: {cv1:.3f}')
            ax.axvline(cv2, color='blue', linestyle='--', label=f'Valor Crítico 2: {cv2:.3f}')
            ax.text(cv1 - 0.1, 0.02, f'{cv1:.2f}', rotation=90, verticalalignment='bottom', color='blue')
            ax.text(cv2 - 0.1, 0.02, f'{cv2:.2f}', rotation=90, verticalalignment='bottom', color='blue')
            title_suffix = f"t = {cv1:.2f}, {cv2:.2f}"

            if test_statistic < cv1 or test_statistic > cv2:
                decision_text = "¡RECHAZAR HIPÓTESIS NULA!"
                decision_color = 'red'
            else:
                decision_text = "No rechazar hipótesis nula."
                decision_color = 'darkgreen'

        elif test_type == 'One-tailed (Upper)':
            cv = t.ppf(1 - alpha, df)

            x_accept = x_std[x_std < cv]
            y_accept = y_std[x_std < cv]
            ax.fill_between(x_accept, 0, y_accept, color='lightgreen', alpha=0.4, label=f'Región de Aceptación ({confidence_level*100:.1f}%)')

            x_reject = x_std[x_std >= cv]
            y_reject = y_std[x_std >= cv]
            ax.fill_between(x_reject, 0, y_reject, color='red', alpha=0.3, label=f'Región de Rechazo (α = {alpha:.3f})')

            ax.axvline(cv, color='blue', linestyle='--', label=f'Valor Crítico: {cv:.3f}')
            ax.text(cv - 0.1, 0.02, f'{cv:.2f}', rotation=90, verticalalignment='bottom', color='blue')
            title_suffix = f"t = {cv:.2f}"

            if test_statistic > cv:
                decision_text = "¡RECHAZAR HIPÓTESIS NULA!"
                decision_color = 'red'
            else:
                decision_text = "No rechazar hipótesis nula."
                decision_color = 'darkgreen'

        else: # One-tailed (Lower)
            cv = t.ppf(alpha, df)

            x_accept = x_std[x_std > cv]
            y_accept = y_std[x_std > cv]
            ax.fill_between(x_accept, 0, y_accept, color='lightgreen', alpha=0.4, label=f'Región de Aceptación ({confidence_level*100:.1f}%)')

            x_reject = x_std[x_std <= cv]
            y_reject = y_std[x_std <= cv]
            ax.fill_between(x_reject, 0, y_reject, color='red', alpha=0.3, label=f'Región de Rechazo (α = {alpha:.3f})')

            ax.axvline(cv, color='blue', linestyle='--', label=f'Valor Crítico: {cv:.3f}')
            ax.text(cv - 0.1, 0.02, f'{cv:.2f}', rotation=90, verticalalignment='bottom', color='blue')
            title_suffix = f"t = {cv:.2f}"

            if test_statistic < cv:
                decision_text = "¡RECHAZAR HIPÓTESIS NULA!"
                decision_color = 'red'
            else:
                decision_text = "No rechazar hipótesis nula."
                decision_color = 'darkgreen'

    ax.plot(x_std, y_std, color='black', label='Densidad de Probabilidad')

    # Línea punteada roja para la Media Hipotética (0 estandarizado)
    ax.axvline(0, color='red', linestyle=':', linewidth=2, label=f'Media Hipotética (μ₀) estandarizada (0)')
    all_relevant_points.append(0) # Asegurar que el 0 se incluya en el rango del eje X

    # Línea del estadístico de prueba en ax
    ax.axvline(test_statistic, color='purple', linestyle='-', linewidth=2, label=f'Estadístico de Prueba: {test_statistic:.3f}')
    ax.text(test_statistic + 0.05, ax.get_ylim()[1] * 0.5,
             f'{test_statistic:.3f}',
             color='purple', rotation=90, verticalalignment='center', horizontalalignment='left',
             bbox=dict(boxstyle='round,pad=0.2', fc='white', ec='none', alpha=0.7))

    # --- Dibujar el Intervalo de Confianza en la gráfica Estandarizada (franja naranja) ---
    # Este CI está centrado en el estadístico de prueba y su ancho es 2 * ci_critical_value
    # Si este CI incluye el 0 (el valor hipotetizado de la media en la escala estandarizada), no se rechaza H0.
    ci_lower_std = test_statistic - ci_critical_value
    ci_upper_std = test_statistic + ci_critical_value

    ci_x_fill = x_std[(x_std >= ci_lower_std) & (x_std <= ci_upper_std)]
    # Usamos la PDF de la distribución principal para rellenar
    ci_y_fill = norm.pdf(ci_x_fill) if dist_type == 'Z-distribution (Normal)' else t.pdf(ci_x_fill, df)
    ax.fill_between(ci_x_fill, 0, ci_y_fill, color='orange', alpha=0.3,
                    label=f'IC {confidence_level*100:.1f}% para μ (centrado en {dist_char})')

    ax.axvline(ci_lower_std, color='darkorange', linestyle=':')
    ax.axvline(ci_upper_std, color='darkorange', linestyle=':')
    ax.text(ci_lower_std, ax.get_ylim()[1]*0.6, f'{ci_lower_std:.2f}', color='darkorange', rotation=90, ha='right', va='center')
    ax.text(ci_upper_std, ax.get_ylim()[1]*0.6, f'{ci_upper_std:.2f}', color='darkorange', rotation=90, ha='left', va='center')


    ax.set_title(f'Valores Críticos y IC para {dist_label}\nNivel de Confianza: {confidence_level*100:.1f}%, α: {alpha:.3f} ({test_type})', color='black', fontweight='bold')
    ax.set_xlabel(f'Valor Estandarizado ({dist_type.split("-")[0].strip()} o t)')
    ax.set_ylabel('Densidad de Probabilidad')
    ax.grid(True, linestyle=':', alpha=0.7)
    ax.legend(loc='upper right')
    ax.set_ylim(bottom=0)

    # --- Configurar el Segundo Eje X (Unidades Reales) ---
    # Función para transformar de estandarizado a real
    def std_to_real_transform(x_std_val):
        # Esta transformación asume que el 0 estandarizado corresponde a hypothesized_mean_real
        return hypothesized_mean_real + x_std_val * standard_error

    # Función para transformar de real a estandarizado (inversa)
    def real_to_std_transform(x_real_val):
        return (x_real_val - hypothesized_mean_real) / standard_error

    sec_ax = ax.secondary_xaxis('top', functions=(std_to_real_transform, real_to_std_transform))
    sec_ax.set_xlabel(f'Valores en Unidades Reales (escala basada en μ₀ = {hypothesized_mean_real:.1f})')

    # Ajustar dinámicamente los límites del eje X principal para incluir todos los puntos
    all_relevant_points.extend([cv for cv in [cv1,cv2,cv] if cv is not None]) # Añadir todos los CV a los puntos de referencia
    all_relevant_points.extend([ci_lower_std, ci_upper_std]) # Añadir los límites del CI estandarizado

    if all_relevant_points:
        min_val_std = min(all_relevant_points)
        max_val_std = max(all_relevant_points)

        if max_val_std - min_val_std > 0.01:
            padding_std = (max_val_std - min_val_std) * 0.2
        else:
            padding_std = 1.5

        lower_bound_std = min(min_val_std - padding_std, -4.0)
        upper_bound_std = max(max_val_std + padding_std, 4.0)

        ax.set_xlim(lower_bound_std, upper_bound_std)
    else:
        ax.set_xlim(-4, 4) # Fallback

    plt.tight_layout()
    plt.show()

    # --- Actualizar la fórmula con valores reales ---
    formula_output.clear_output(wait=True) # Limpiar la salida anterior
    with formula_output:
        # Numerador de la fórmula (diferencia entre media muestral y media hipotética)
        numerator_value_real = sample_mean_real - hypothesized_mean_real

        # Símbolo de la desviación estándar (sigma para Z, s para t)
        std_dev_symbol = r"\sigma" if dist_type == 'Z-distribution (Normal)' else "s"

        # Construir la parte de la fórmula general (ej. (x̄ - μ₀) / (σ / √n))
        general_denominator_latex = f"{std_dev_symbol} / \\sqrt{{n}}"
        if n <= 1: # Ajustar para el caso n=1 en la visualización general de la fórmula
             general_denominator_latex = f"{std_dev_symbol}"

        general_formula_part = f"\\frac{{\\bar{{x}} - \\mu_0}}{{{general_denominator_latex}}}"

        # Construir la parte numérica de la fórmula (ej. (100-90) / 5.2)
        # Denominador numérico es el error estándar ya calculado.
        numerical_denominator_value_for_display = standard_error if standard_error >= 0.001 else 0.001

        # La parte clave del ajuste: la fracción numérica es (numerador) / (error_estandar)
        numerical_formula_part = f"\\frac{{{sample_mean_real:.2f} - {hypothesized_mean_real:.2f}}}{{{numerical_denominator_value_for_display:.3f}}}"

        # Componer la fórmula completa
        formula_latex = f"$${dist_char} = {general_formula_part} = {numerical_formula_part} = {test_statistic:.3f}$$"
        display(Math(formula_latex))


    # --- Actualizar la regla de decisión y el resultado ---
    decision_output.clear_output(wait=True)
    with decision_output:
        rule_text_ht = ""
        # Regla de decisión de la prueba de hipótesis (en Z/t)
        if test_type == 'Two-tailed':
            if cv1 is not None and cv2 is not None:
                rule_text_ht = f"Rechazar H₀ si {dist_char} < {cv1:.3f} o {dist_char} > {cv2:.3f}"
            else:
                rule_text_ht = "Cálculo de valores críticos pendiente."
        elif test_type == 'One-tailed (Upper)':
            if cv is not None:
                rule_text_ht = f"Rechazar H₀ si {dist_char} > {cv:.3f}"
            else:
                rule_text_ht = "Cálculo de valores críticos pendiente."
        else: # One-tailed (Lower)
            if cv is not None:
                rule_text_ht = f"Rechazar H₀ si {dist_char} < {cv:.3f}"
            else:
                rule_text_ht = "Cálculo de valores críticos pendiente."

        # Regla de decisión del Intervalo de Confianza (equivalente)
        # Aquí, el 0 estandarizado representa la media hipotetizada μ₀
        ci_decision_rule = ""
        if ci_lower_std <= 0 <= ci_upper_std:
            ci_decision_rule = f"0 (μ₀ estandarizada) CAE DENTRO del IC [{ci_lower_std:.3f}, {ci_upper_std:.3f}]."
        else:
            ci_decision_rule = f"0 (μ₀ estandarizada) NO CAE DENTRO del IC [{ci_lower_std:.3f}, {ci_upper_std:.3f}]."


        # Resumen de la decisión final (consistente con ambas reglas)
        final_decision_html = f"<p style='font-size:1.2em; color: {decision_color};'><b>Decisión Final: {decision_text}</b></p>"

        display(HTML(f"<p style='font-size:1.1em;'><b>Regla de Decisión (Z/t estandarizado):</b> <span style='color:black;'>{rule_text_ht}</span></p>"
                     f"<p style='font-size:1.1em;'><b>Regla de Decisión (Intervalo de Confianza {confidence_level*100:.1f}%):</b> <span style='color:black;'>{ci_decision_rule}</span></p>"
                     f"{final_decision_html}"))

# --- 3. FUNCIONES PARA ACTUALIZAR SLIDERS (REFERENCIAN WIDGETS YA DECLARADOS) ---

# Función para actualizar los rangos de los sliders reales
def update_real_ranges(*args):
    # Asegúrate de que los valores de min/max sean válidos (ej. min < max)
    new_min_mean = min(mean_min_input.value, mean_max_input.value - 0.1) # Asegura que min sea menor que max
    new_max_mean = max(mean_max_input.value, new_min_mean + 0.1) # Asegura que max sea mayor que min
    new_max_std = max(std_max_input.value, 0.1) # Desviación estándar mínima 0.1 para un rango

    # Actualizar sliders de media
    current_val_hyp = hypothesized_mean_real_slider.value
    hypothesized_mean_real_slider.min = new_min_mean
    hypothesized_mean_real_slider.max = new_max_mean
    # Asegurarse de que el valor actual no esté fuera del nuevo rango
    hypothesized_mean_real_slider.value = np.clip(current_val_hyp, new_min_mean, new_max_mean)

    current_val_sample = sample_mean_real_slider.value
    sample_mean_real_slider.min = new_min_mean
    sample_mean_real_slider.max = new_max_mean
    # Asegurarse de que el valor actual no esté fuera del nuevo rango
    sample_mean_real_slider.value = np.clip(current_val_sample, new_min_mean, new_max_mean)

    # Actualizar slider de desviación estándar
    current_val_std = std_dev_real_slider.value
    std_dev_real_slider.max = new_max_std
    # Asegurarse de que el valor actual no esté fuera del nuevo rango (min ya es 0.01)
    std_dev_real_slider.value = np.clip(current_val_std, 0.01, new_max_std)


# Función para actualizar la descripción del slider de desviación estándar (sigue siendo relevante para σ o s)
def update_std_dev_description(*args):
    if dist_type_dropdown.value == 't-distribution':
        std_dev_real_slider.description = 'Desv. Estándar Muestra (s):'
    else: # Z-distribution
        std_dev_real_slider.description = 'Desv. Estándar Población (σ):'

# --- 4. CONFIGURAR OBSERVADORES Y LA INTERFAZ ---

# Observar cambios en los inputs de rango
# 'continuous_update=False' para que no se actualice con cada tecleo, solo al finalizar la edición
mean_min_input.observe(update_real_ranges, 'value')
mean_max_input.observe(update_real_ranges, 'value')
std_max_input.observe(update_real_ranges, 'value')

# Observar cambios en el dropdown de tipo de distribución
dist_type_dropdown.observe(update_std_dev_description, 'value')

# Enlazar la función de actualización del gráfico con los widgets
plot_interactive_output = widgets.interactive_output(update_plot, {
    'confidence_level': confidence_slider,
    'dist_type': dist_type_dropdown,
    'sample_size': sample_size_slider,
    'test_type': test_type_dropdown,
    'hypothesized_mean_real': hypothesized_mean_real_slider,
    'sample_mean_real': sample_mean_real_slider,
    'std_dev_real': std_dev_real_slider
})

# Panel de control con los widgets
controls_panel = widgets.VBox([
    widgets.HTML("<h3>Ajustar Rangos de Valores Reales:</h3>"),
    widgets.HBox([widgets.Label('Rango de Medias:'), mean_min_input, mean_max_input]),
    widgets.HBox([widgets.Label('Max Desv. Est. Real:'), std_max_input]), # Añadir etiqueta para este input
    widgets.HTML("<hr><h3>Parámetros de Prueba Estadística:</h3>"),
    widgets.HBox([widgets.Label('Nivel de Confianza:'), confidence_slider]),
    widgets.HBox([widgets.Label('Distribución:'), dist_type_dropdown]),
    widgets.HBox([widgets.Label('Tipo de Prueba:'), test_type_dropdown]),
    widgets.HBox([widgets.Label('Tamaño de Muestra (n):'), sample_size_slider]),
    widgets.HTML("<hr><b>Simulación del Estadístico de Prueba (con valores reales)</b><hr>"),
    formula_output, # Aquí se muestra la fórmula
    widgets.HBox([widgets.Label('Media Hipotética (μ₀):'), hypothesized_mean_real_slider]),
    widgets.HBox([widgets.Label('Media Muestral (x̄):'), sample_mean_real_slider]),
    widgets.HBox([widgets.Label('Desv. Estándar (σ/s):'), std_dev_real_slider]),
])

# Mostrar el panel de control, el gráfico interactivo y la salida de decisión
display(widgets.VBox([controls_panel, plot_interactive_output, decision_output]))

# --- 5. LLAMADAS INICIALES PARA SINCRONIZAR ESTADO (AHORA MÁS SEGURAS) ---
# Estas llamadas se hacen después de que todos los widgets han sido instanciados.
update_std_dev_description() # Configura la descripción inicial de la desviación estándar
update_real_ranges() # Configura los rangos iniciales de los sliders reales

VBox(children=(VBox(children=(HTML(value='<h3>Ajustar Rangos de Valores Reales:</h3>'), HBox(children=(Label(v…