# **Pruebas de Hipótesis en Estadística**

## **1. Introducción**
En estadística inferencial, las pruebas de hipótesis son procedimientos utilizados para tomar decisiones o sacar conclusiones sobre una población a partir de una muestra de datos. Estas pruebas permiten evaluar la validez de una afirmación sobre un parámetro poblacional, basándose en evidencia empírica.

Una prueba de hipótesis se utiliza para evaluar las afirmaciones sobre los parámetros de una población, basándose en una muestra de datos.

## **2. Conceptos Clave**

### **2.1 Hipótesis Nula ($H_0$) y Hipótesis Alternativa ($H_A$)**

- **Hipótesis Nula ($H_0$)**: Es la suposición inicial que se somete a prueba. Generalmente representa el estado actual, la ausencia de efecto o la igualdad entre grupos.  
  $$ H_0: \mu = \mu_0 $$

  
  *La media de la población es igual a un valor específico μ*

- **Hipótesis Alternativa ($H_A$)**: Representa un cambio o diferencia significativa respecto a la hipótesis nula. En una prueba bilateral, indica que el parámetro es diferente (mayor o menor) al valor de la hipótesis nula:  
  $$ H_A: \mu \neq \mu_0 $$  
  *La media de la población es diferente de μ.*

En este caso, una prueba bilateral significa que estamos interesados en detectar diferencias en ambos sentidos (mayor o menor), lo que afecta el cálculo del p-valor y la región de rechazo.

### **2.2 Prueba de Hipótesis y los Tres Escenarios**
    
**1.1. Prueba de dos colas (Ha: μ ≠ 0)**

¿Qué significa? La hipótesis alternativa es que la media poblacional no es igual a 0. Es decir, estamos interesados en si la media se desvía en cualquiera de las dos direcciones, ya sea positiva o negativa.

Cálculo del valor p: Cuando se realiza una prueba de dos colas, el valor p se calcula como el área bajo la curva normal (distribución estándar) en ambos lados del valor observado z (la estadística de prueba).

**1.2. Prueba de cola superior (Ha: μ > 0)**

¿Qué significa? La hipótesis alternativa es que la media poblacional es mayor que 0. En este caso, estamos interesados solo en los valores de la estadística de prueba que caen en la cola superior de la distribución (valores mayores a 0).

Cálculo del valor p: En este caso, el valor p se calcula como la probabilidad de que la estadística de prueba sea mayor que el valor observado 𝑧

**1.3. Prueba de cola inferior (Ha: μ < 0)**

¿Qué significa? La hipótesis alternativa es que la media poblacional es menor que 0. En este caso, estamos interesados solo en los valores de la estadística de prueba que caen en la cola inferior de la distribución (valores menores a 0).

Cálculo del valor p: En este caso, el valor p se calcula como la probabilidad de que la estadística de prueba sea menor que el valor observado z

### **2.3 Nivel de Significancia ($\alpha$) y Región Crítica**
- **Nivel de significancia ($\alpha$)**: Probabilidad de cometer un error Tipo I (rechazar $H_0$ cuando es verdadera). Comúnmente se usa $\alpha = 0.05$ o $\alpha = 0.01$.
- **Región crítica**: Conjunto de valores del estadístico de prueba que llevan al rechazo de $H_0$. Se define por los valores críticos de la distribución correspondiente.

## **3. Métodos para Tomar Decisiones en Pruebas de Hipótesis**

### **3.1 Método del Estadístico de Prueba**
Este método compara el estadístico de prueba con valores críticos de la distribución correspondiente. Nos indica cuántas desviaciones estándar está la media muestral de la media poblacional bajo la hipótesis nula

El estadístico de prueba se calcula como:
$$ Z_{hat} = \frac{\bar{X} - \mu_0}{\sigma / \sqrt{n}} $$
Si $Z_{hat}$ está fuera del intervalo crítico, se rechaza $H_0$.

Este valor nos permite comparar la diferencia entre la media de la muestra y la media poblacional de manera estandarizada. Si la diferencia entre el valor muestral y el valor poblacional es significativamente grande, esto sugiere que el valor de la muestra es poco probable que provenga de una población cuya media es el valor bajo la hipótesis nula. En otras palabras, podemos rechazar la hipótesis nula.

Distribución normal estándar : Es la distribución normal con media 0 y desviación estándar 1.

La distribución de la media muestral sigue una distribución normal con un tamaño de muestra muy grande, independientemente de la distribución de la población.

### **3.2 ¿Cuando se usa la distribución normal 𝑍 en lugar de la t?**

Esto significa que cuando la muestra es grande ( 𝑛 > 30 en general), la distribución muestral de la media sigue aproximadamente una normal (Z) por el Teorema del Límite Central. Si 𝑛 fuera pequeño, se usaría la distribución t de Student, que corrige la mayor variabilidad con muestras pequeñas.







En la prueba 𝑍 se usa la desviación estándar poblacional σ, que es un valor conocido.

En la prueba 𝑡 se usa la desviación estándar muestral 𝑠 , ya que 𝜎 no es conocida.

**3.2.1 La distribución t** 

La distribución t es una distribución simétrica, similar a la distribución z, pero con colas más anchas. Esta forma más ancha significa que tiene más probabilidad de tomar valores extremos.

La forma de la distribución t depende de los grados de libertad, que se calculan como n - 1, donde n es el tamaño de la muestra. A medida que aumenta el tamaño de la muestra, la distribución t se va acercando más a la distribución z.

Si el tamaño de la muestra es suficientemente grande, podemos tratar la distribución t como si fuera la distribución z.

### **3.3 Método del p-valor**
Se compara el p-valor con el nivel de significancia $\alpha$:

- Si $p\text{-valor} < \alpha$, se **rechaza** $H_0$.

En este caso, rechazamos la hipótesis nula y decimos que los resultados son estadísticamente significativos, lo que significa que probablemente hay una relación real o efecto en los datos que estamos analizando. Los datos proporcionan suficiente evidencia para concluir que el efecto observado no es aleatorio
  
- Si $p\text{-valor} \geq \alpha$, **no se rechaza** $H_0$.

Esto indica que los resultados observados pueden haber ocurrido por azar (dentro de un rango de probabilidad razonable bajo la hipótesis nula). En este caso, no rechazamos la hipótesis nula y no tenemos suficiente evidencia para afirmar que existe una relación real o efecto en los datos.

## **4. Información Adicional**
### **4.1 Relación entre Conceptos Clave**
| Concepto | Definición | Interpretación | Relación con otros valores |
|----------|------------|---------------|----------------|
| Nivel de significancia$\alpha$ | Umbral de error Tipo I - indica la probabilidad máxima de cometer un error tipo I (rechazar Ho) cuando es verdadera. | Si $p < \alpha$, se rechaza $H_0$. | Se compara con el valor $p$. |
| Valor p (p-value) | Probabilidad de obtener un resultado tan extremo (o más) que el valor observado, suponiendo que ( Ho ) es verdadera. | Indica evidencia contra $H_0$. | Se calcula a partir de $z$. |
| Valor observado (z-score) | Posición en la distribución normal estándar | Si $z$ es grande, $p$ es pequeño. | Se usa en la distribución normal estándar. |

- **Error Tipo I** Rechazar la hipótesis nula cuando en realidad es verdadera. La probabilidad de cometer este error es igual al nivel de significancia (α). En este caso, tenemos un 5% de probabilidad de rechazar una hipótesis nula que realmente es cierta.

- **Error Tipo II** No rechazar la hipótesis nula cuando en realidad es falsa. La probabilidad de cometer un error de tipo II depende de cuán grande sea la verdadera diferencia entre las medias.

## **6. Conclusiones**
Las pruebas de hipótesis permiten evaluar la validez de afirmaciones sobre poblaciones. Se pueden utilizar dos enfoques equivalentes para la toma de decisiones:
1. **El método del estadístico de prueba**, que compara con valores críticos.
2. **El método del p-valor**, que compara con el nivel de significancia.

Ambos métodos llevan a la misma decisión y son fundamentales en el análisis estadístico.