# Módulo: Inferencia Estadística
## T10a: Pruebas de hipótesis

# Objetivos de la clase
- Comprender el concepto de hipótesis estadística y aprender la formulación de una prueba de hipótesis
- Realizar pruebas de hipótesis sobre la media
- Realizar pruebas de hipótesis sobre la varianza


# Hipótesis estadísticas


## Definiciones y fundamentos

Una **hipótesis estadística** es una aseveración o conjetura respecto de una o más poblaciones.

*Ejemplos*:
- "La altura media de los estudiantes es mayor a 1.65 m"
- "No hay relación entre el consumo de café y calidad del sueño"
- "Escuchar música de rock mejora el rendimiento escolar"

<center>
    <img src="figures/hypo-1.jpg" width="600"/>
</center>

La verdad o falsedad de la hipótesis nunca se sabe con **absoluta certeza**, ya que es muy difícil analizar a toda la población.

En cambio, solo se analiza una muestra aleatoria. Esto lleva a que el aceptar o rechazar una hipótesis ocurra con **cierto grado de probabilidad**.

<br><center>
    <img src="figures/hypo-2.png" width="700"/>
</center>

Si la **evidencia** de la muestra es inconsistente con la hipótesis, entonces la hipótesis se rechaza.

*Ejemplo*:
<dl>
<dt>Hipótesis estadística</dt>
<dd>"La altura media de los estudiantes es mayor a 1.65 m"</dd>
<dt>Muestra aleatoria</dt>
<dd>Al medir 100 estudiantes resulta una altura promedio de 1.61 m con probabilidad 0.95</dd>
<dt>Decisión</dt>
<dd>Se rechaza la hipótesis planteada en base a la evidencia</dd>
</dl>


Este rechazo solo deja una pequeña probabilidad de que la hipótesis sea verdadera.



Ya que es más sencillo encontrar evidencia en contra de algo que a favor de algo, la formulación de la hipótesis debe ser tal que **su rechazo proporcione información respecto del fenómeno** a analizar.

<center>
    <img src="figures/hypo-4.png" width="500"/>
</center>

*Ejemplo*:

Se quiere apoyar la afirmación que el sensor A es más preciso que el sensor B

&#10148; Hipótesis: "No hay diferencia en la precisión de los dos tipos de sensores"

&#10148; Evidencia: En una muestra resultó los sensores A eran 15% más precisos que los sensores B

&#10148; Decisión: Procedemos a rechazar la hipótesis, lo que ayuda a reafirmar nuestra afirmación inicial



## Prueba de hipótesis

Formalmente, en una prueba de hipótesis se define una **hipótesis nula** $H_0$ y una **hipótesis alternativa** $H_1$

El rechazo de la hipótesis nula $H_0$ conduce a la aceptación de la hipótesis alternativa $H_1$

Entonces, la hipótesis alternativa $H_1$ representa a la pregunta que se responderá en la prueba de hipótesis.

<br><center>
    <img src="figures/hypo-6.png" width="600"/>
</center>

Se define el **estadístico de prueba** como la variable estadística que se utiliza para intentar rechazar la hipótesis nula en favor de la hipótesis alternativa.

Se llama **región crítica** al rango de valores del estadístico de prueba donde se rechaza la hipótesis nula

**Ejemplo:** Queremos probar si el fertilizante ayuda al crecimiento de las plantas.

<center>
    <img src="figures/plant.jpg" width="450"/>
</center>

<div class="well">
<center>
$H_0:$ el fertilizante no ayuda al crecimiento de las plantas
</center>
<center>
$H_1:$ el fertilizante sí ayuda al crecimiento de las plantas
</center>
</div>

Se define que la región crítica es una altura media mayor a 10 cm. Este valor sería el **valor crítico**

Si en la muestra se obtiene una altura media de 15 cm, entonces se rechaza $H_0$ para favorecer a $H_1$    

## Tipos de error

Hay 2 tipos de errores en la toma de una decisión respecto de una hipótesis:

<dl>
<dt>Error tipo I</dt>
<dd>Se rechaza la hipótesis nula cuando esta en realidad es verdadera</dd>
<dt>Error tipo II</dt>
<dd>No se rechaza la hipótesis nula cuando esta en realidad es falsa</dd>
</dl>

<center>
    <img src="figures/hipo-2b.png" width="1000"/>
</center>

La probabilidad de cometer un error de tipo I se llama **nivel de significancia** y se denota $\alpha$.


# Pruebas respecto de una sola media

## Pruebas para una media (varianza conocida)
Supongamos un experimento del que se extraen $n$ observaciones $X_1$, $X_2$, ..., $X_n$ aleatorias desde una población con media $\mu$ y varianza $\sigma^2$.

Para probar las hipótesis:

\begin{align}
H_0: \mu = \mu_0 \\
H_1: \mu \neq \mu_0
\end{align}

usaremos la variable estadística de prueba $\overline{X}$ que en condiciones del TLC tiene distribución normal con:

\begin{equation}
\mu_{\overline{X}} = \mu \\
\sigma_{\overline{X}}^2 = \sigma^2/n
\end{equation}


Bajo la hipótesis nula $H_0$ ($\mu = \mu_0$), de acuerdo al intervalo de confianza, se cumplirá que:

\begin{align}
    P \left( -z_{\alpha /2} < \frac{ \overline{X} - \mu_0 }{ \sigma / \sqrt{n} } < z_{\alpha /2} \right) = 1 - \alpha
\end{align}

donde $\alpha$ será entonces la probabilidad de cometer un error de tipo I (rechazar una hipótesis verdadera). Es decir, $\alpha$ es la probabilidad de que el valor estandarizado de $\overline{X}$ no se encuentre en el rango indicado.

<center>
    <img src="figures/norm-interval-1.png" width="500"/>
</center>

Si el valor estandarizado de $\overline{X}$ no está dentro de ese rango, se procede a rechazar la hipótesis nula en favor de la hipótesis alternativa $H_1$ ($\mu \neq \mu_0$)



Dado un valor $\overline{x}$ la prueba de hipótesis implica rechazar $H_0$ si la variable estadística $z$ cae en la región crítica descrita a continuación:

<div class="well">
\begin{align}
    z & = \frac{ \overline{x} - \mu_0 }{ \sigma / \sqrt{n} } > z_{\alpha/2} &
    \text{o} & &
    z & = \frac{ \overline{x} - \mu_0 }{ \sigma / \sqrt{n} } < -z_{\alpha/2}
\end{align}
</div>
    
El rechazo de $H_0$ implica aceptar la hipótesis alternativa $H_1$ que $\mu \neq \mu_0$. La probabilidad de rechazar equivocadamente $H_0$ es $\alpha$.

<center>
    <img src="figures/norm-x-1.png" width="500"/>
</center>

Por otro lado, si $-z_{\alpha /2} < z < z_{\alpha /2}$ entonces $H_0$ no se rechaza.



La formulación anterior se conoce como **bilateral**, ya que interesaba probar que $z$ estuviera hacia la izquierda o hacia la derecha del rango dado para poder rechazar $H_0$ en favor de $H_1$.

En caso que se quiera probar una hipótesis **unilateral** del tipo:

\begin{align}
H_0: \mu = \mu_0 \\
H_1: \mu > \mu_0
\end{align}

se requiere valores grandes de $z$ para favorecer a $H_1$. Entonces el rechazo de $H_0$ resulta solo de probar:

\begin{align}
    z = \frac{ \overline{x} - \mu_0 }{ \sigma / \sqrt{n} } > z_{\alpha}
\end{align}

<font color=darkred>Note que en este caso la región crítica queda solo en la cola derecha distribución normal </font>

De la misma forma, para una hipótesis **unilateral**  del tipo:

\begin{align}
H_0: \mu = \mu_0 \\
H_1: \mu < \mu_0
\end{align}

la región crítica estará en:

\begin{align}
    z = \frac{ \overline{x} - \mu_0 }{ \sigma / \sqrt{n} } < - z_{\alpha}
\end{align}

<font color=darkred>Note que en este caso la región crítica queda solo en la cola izquierda distribución normal </font>

**Ejemplo**: Una muestra aleatoria de **100** fallecimientos arrojó una vida promedio de **71.8 años**. Si la desviación estándar de la población es **8.9 años**, ¿la muestra indica que la vida media actual es mayor a **70 años**? Considerar un nivel de significancia de **0.05**.

Se plantean las hipótesis a probar:

\begin{align}
H_0: \mu = 70 \\
H_1: \mu > 70
\end{align}

Para favorecer $H_1$ intentaremos rechazar $H_0$ usando como región crítica la cola derecha de la distribución normal estándar con una significancia (probabilidad) de $\alpha = 0.05$

<center>
    <img src="figures/table-norm-1.png" width="1300"/>
</center>


Seleccionamos el valor crítico $z_{\alpha} = 1.64$. Si nuestro valor $z$ está a la derecha de este valor crítico, entonces podemos rechazar la hipótesis nula en favor de la hipótesis alternativa.

Para $\overline{x} = 71.8$, $\sigma = 8.9$ y $n=100$ se tiene:

\begin{align}
    z = \frac{ 71.8 - 70 }{ 8.9 / \sqrt{100} } = 2.02
\end{align}

✅ Se decide rechazar $H_0$ para concluir que la vida media actual sí es mayor a 70 años.

El nivel de significancia de 0.05 significa que tenemos una probabilidad de 0.05 de habernos equivocado en rechazar $H_0$

## Pruebas para una media (varianza desconocida)

Para una **población normal** de varianza desconocida la formulación es similar, pero usando la distribución $t$ en vez de la distribución normal.


Dada la hipótesis bilateral:

\begin{align}
H_0: \mu = \mu_0 \\
H_1: \mu \neq \mu_0
\end{align}

se rechaza $H_0$ a un nivel de significancia $\alpha$ cuando la variable estadística de prueba $t$ cumple que:

<div class="well">
\begin{align}
    t & = \frac{ \overline{x} - \mu_0 }{ s / \sqrt{n} } > t_{\alpha/2} &
    \text{o} & &
    t & = \frac{ \overline{x} - \mu_0 }{ s / \sqrt{n} } < -t_{\alpha/2}
\end{align}
</div>

con $\nu = n-1$ grados de libertad


Para pruebas **unilaterales** (de una cola) las regiones críticas donde se rechaza $H_0$ a favor de $H_1$ son:

&#10148; Para $H_1: \mu > \mu_0$

\begin{align}
    t = \frac{ \overline{x} - \mu_0 }{ s / \sqrt{n} } > t_{\alpha}
\end{align}

&#10148; Para $H_1: \mu < \mu_0$

\begin{align}
    t = \frac{ \overline{x} - \mu_0 }{ s / \sqrt{n} } < -t_{\alpha}
\end{align}

donde $t_{\alpha}$ es el valor $t$ que deja un área de $\alpha$ a la derecha de la distribución $t$ con $\nu = n-1$ grados de libertad

**Ejemplo**: Se afirma que cierto componente electrónico consume **46 kWh** de energía al año. En una muestra de **12** componentes se encontró que el consumo promedio fue de **42 kWh** con una desviación estándar de **11.9 kWh**. ¿Se puede concluir que los componentes consumen en promedio **menos de 46 kWh** con un nivel de significancia **0.05**? Suponer una distribución normal.

Se plantean las hipótesis a probar:

\begin{align}
H_0: \mu = 46\\
H_1: \mu < 46
\end{align}

Para favorecer $H_1$ intentaremos rechazar $H_0$ usando como región crítica la cola izquierda de la distribución $t$ con una significancia (probabilidad) de $\alpha = 0.05$

<center>
    <img src="figures/distr-t-2.png" width="1400"/>
</center>



Dado que la distribución es simétrica, seleccionamos el valor crítico $t_{\alpha} = -1.796$. 


Si nuestro valor $t$ está a la izquierda del valor crítico, entonces podemos rechazar $H_0$ en favor de $H_1$

Para $\overline{x} = 42$, $s = 11.9$ y $n=12$ se tiene:

\begin{align}
    t = \frac{ 42 - 46 }{ 11.9 / \sqrt{12} } = -1.16
\end{align}

✅ Se decide no rechazar $H_0$ , es decir, que el consumo promedio de los componentes no es significativamente menor a 46 kWh.

# Pruebas respecto de una sola varianza


Para probar hipótesis respecto de la varianza (o desviación estándar) de una **población normal**, recurrimos a la variable estadística de prueba **chi cuadrada**:

\begin{align}
    \chi^2 = \frac{(n-1) s^2}{\sigma_{0}^2}
\end{align}

Usando esta variable podemos probar una hipótesis nula del tipo 

\begin{align}
H_0: \sigma^{2} = \sigma_0^{2}
\end{align}

contra hipótesis alternativas comunes como:

\begin{align}
H_1: \sigma^{2} & \neq \sigma_0^{2} &
H_1: \sigma^{2} & > \sigma_0^{2} &
H_1: \sigma^{2} & < \sigma_0^{2}
\end{align}

Para una prueba **bilateral** (de dos colas) la región crítica donde se rechaza $H_0$ es:

&#10148; Para $H_1: \sigma^{2} \neq \sigma_0^{2}$

\begin{align}
    \chi^{2} & < \chi_{1-\alpha /2}^2 &
    \text{o} & &
    \chi^{2} & > \chi_{\alpha /2}^2 &
\end{align}

Para pruebas **unilaterales** (de una cola) las regiones críticas donde se rechaza $H_0$ son:

&#10148; Para $H_1: \sigma^{2} > \sigma_0^{2}$

\begin{align}
    \chi^{2} > \chi_{\alpha }^2
\end{align}

&#10148; Para $H_1: \sigma^{2} < \sigma_0^{2}$

\begin{align}
    \chi^{2} < \chi_{1 - \alpha }^2
\end{align}

Todas para una distribución chi cuadrada con $\nu = n-1$ grados de libertad 

**Ejemplo**: Un fabricante de pernos asegura que el largo de sus pernos tiene desviación estándar de **0.9 mm** con una distribución normal. Si una muestra de **10** pernos tiene una desviación estándar de **1.2 mm**, ¿se puede considerar que $\sigma > 0.9$? Considerar un nivel de significancia **0.05**. 

Se plantean las hipótesis a probar:

\begin{align}
H_0: \sigma = 0.9\\
H_1: \sigma > 0.9
\end{align}

Para favorecer $H_1$ intentaremos rechazar $H_0$ usando como región crítica la cola derecha de la distribución chi cuadrada con una significancia (probabilidad) de $\alpha = 0.05$

<center>
    <img src="figures/distr-chi-1.png" width="1400"/>
</center>


Seleccionamos el valor crítico $\chi^2_{\alpha} = 16.919$ para $\nu = 10 - 1 = 9$

Si nuestro valor $\chi^2$ está a la derecha del valor crítico, entonces podemos rechazar $H_0$ en favor de $H_1$

Para $s = 1.2$, $\sigma_0 = 0.9$ y $n=10$ se tiene:

\begin{align}
    \chi^2 = \frac{(10-1) (1.2)^2}{(0.9)^2} = 16
\end{align}


✅ Se decide no rechazar $H_0$ ya que no hay evidencia con un nivel de significancia 0.05 que $\sigma > 0.9$

# Sumario
- La prueba de hipótesis consiste en establecer una hipótesis nula y una alternativa, con el objetivo de rechazar la hipótesis nula en favor de la hipótesis alternativa
- Para las pruebas de hipótesis sobre la media usamos la distribución normal si conocemos la varianza de la población o la distribución $t$ si la varianza es desconocida.
- Para las pruebas de hipótesis sobre la varianza usamos la distribución chi cuadrada.