![imagenes](logo.png)

Ya hemos visto tres conceptos importantes asociados a los contrastes de hipótesis:

* Estadístico de contraste
* Nivel de significancia
* $p$-valor

De esta manera, si conocemos el nivel de significancia $\alpha$, la decisión que tomemos se puede basar en:

* **El intervalo de confianza:** si el parámetro poblacional propuesto cae dentro de un intervalo de confianza con significancia $\alpha$ construido a partir del estadístico de contraste, rechazamos $H_1$.

* **El $p$-valor:** si el $p$-valor es mas pequeño que $\alpha$, rechazamos $H_0$. Si el $p$-valor es mas grande que $\alpha$, rechazamos $H_1$.

En este caso, conviene basar la decisión en ambos criterios.

Por otra parte, si no conocemos el nivel de significancia $\alpha$, la decisión que tomemos se basará en el $p$-valor: si el $p$-valor es pequeño ($<0.05$), rechazamos $H_0$; si el $p$-valor es grande ($>0.1$), rechazamos $H_1$; si el $p$-valor está entre 0.05 y 0.1, se recomienda realizar mas estudios.

Población|Parámetro|$H_1$|$n$|Desviación|Estadístico de contraste|Intervalo de confianza|$p$-valor
:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:
Norm|$\mu$|$>\mu_0$|No importa|conocida|$Z=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}$|$\left(\overline{X}-\frac{z_{1-\alpha}\sigma}{\sqrt{n}},\infty\right)$|$P(Z>z_0)$
Norm|$\mu$|$<\mu_0$|No importa|conocida|$Z=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}$|$\left(-\infty,\overline{X}+\frac{z_{1-\alpha}\sigma}{\sqrt{n}}\right)$|$P(Z<z_0)$
Norm|$\mu$|$!=\mu_0$|No importa|conocida|$Z=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}$|$\left(\overline{X}-\frac{z_{1-\alpha/2}\sigma}{\sqrt{n}},\overline{X}+\frac{z_{1-\alpha/2}\sigma}{\sqrt{n}}\right)$|$2P(Z>\mid z_0\mid)$
Norm, Gral|$\mu$|$>\mu_0$|No importa|desconocida|$T=\frac{\overline{X}-\mu_0}{S/\sqrt{n}}$|$\left(T-\frac{t_{n-1,1-\alpha}S}{\sqrt{n}},\infty\right)$|$P(T>t_0)$
Norm, Gral|$\mu$|$<\mu_0$|No importa|desconocida|$T=\frac{\overline{X}-\mu_0}{S/\sqrt{n}}$|$\left(-\infty,T+\frac{t_{n-1,1-\alpha}S}{\sqrt{n}}\right)$|$P(T<t_0)$
Norm, Gral|$\mu$|$!=\mu_0$|No importa|desconocida|$T=\frac{\overline{X}-\mu_0}{S/\sqrt{n}}$|$\left(T-\frac{t_{n-1,1-\alpha/2}S}{\sqrt{n}},T+\frac{t_{n-1,1-\alpha/2}S}{\sqrt{n}}\right)$|$2P(T>\mid t_0\mid)$
No importa|$p$|$>p_0$|No importa|No aplica|$E=Bin(n,p_0)$||$P(E\ge x_0)$
No importa|$p$|$<p_0$|No importa|No aplica|$E=Bin(n,p_0)$||$P(E\le x_0)$
No importa|$p$|$!=p_0$|No importa|No aplica|$E=Bin(n,p_0)$||$2\min\{P(E\ge x_0),P(E\le x_0)\}$
Norm|$\sigma$|$>\sigma_0$|No importa|No aplica|$\chi^2=\frac{(n-1)S^2}{\sigma_0^2}$||$P(\chi^2>\chi^2_0)$
Norm|$\sigma$|$<\sigma_0$|No importa|No aplica|$\chi^2=\frac{(n-1)S^2}{\sigma_0^2}$||$P(\chi^2<\chi^2_0)$
Norm|$\sigma$|$!=\sigma_0$|No importa|No aplica|$\chi^2=\frac{(n-1)S^2}{\sigma_0^2}$||2$\min\{P(\chi^2>\chi^2_0),P(\chi^2<\chi^2_0)\}$

Y tenemos las decisiones:

Criterio|Descripción|Decisión
:--|:--|:--
Intervalo de confianza|$\theta_0\in I$|Rechazar $H_1$
p-valor|$>\alpha$ o grande|Rechazar $H_1$

**EN CASO DE QUE AMBOS CRITERIOS SE CONTRADIGAN, TOMA EL DEL INTERVALO DE CONFIANZA**


## Pruebas de hipótesis en **R**

Como podrás imaginarte, los cálculos anteriores son poco prácticos para realizarlos "manualmente".

Para desarrollarlos mediante **R** contamos con la ya conocida paquetería ``BSDA`` para ``z.test`` y ``t.test`` para los contrastes de medias. En tanto para contrastes de proporciones contamos con la función ``binom.test``, la cual ya está incluida en **R** sin tener que instalar paqueterías extras.

Además, para los contrastes de desviación contamos con la función ``sigma.test`` de la paquetería ``TeachingDemos``.

Las sintaxis son las siguientes:

Función|Paquetería
:--|:--:
``z.test(x,alternative,mu,sigma.x,conf.level)``|BSDA
``t.test(x,alternative,mu,conf.level)``|BSDA
``sigma.test(x,sigma,alternative,conf.level)``|TeachingDemos
``binom.test(x,n,p,alternative,conf.level)``|Ninguna

donde:

``x`` son los valores de la muestra en el caso de prueba de hipótesis para la media o la desviación; en el caso de prueba de hipótesis para la proporción, es el número de éxitos.

``mu`` es el valor de la media propuesta en $H_0$ para prueba de hipótesis para la media (es decir, $\mu_0$).

``sigma.x`` es el valor de la desviación en caso de conocerse.

``sigma`` es el valor de la desviación propuesta en $H_0$ para prueba de hipótesis para la desviación (es decir, $\sigma_0$)

``n`` es el tamaño de la muestra.

``p`` es el valor de la proporción propuesta en $H_0$ para prueba de hipótesis para la proporción (es decir, $p_0$). Recuerda que es un valor entre 0 y 1.

``conf.level`` es 1-$\alpha$.

``alternative`` es el tipo de hipótesis alternativa. Puede ser ``"two.sided"`` (bilateral), ``"less"`` ($\theta<\theta_0$) o ``"greater"`` ($\theta>\theta_0$)




***
***
**Ejemplo 1.**

A un productor se le ofrece un nutriente con el que obtendrá rendimientos medios superiores a 2.000 kg/ha, que es la producción usual de la zona. Se sabe que en esa población los rendimientos tienen un desvío estándar de 210 kg/ha y que la distribución de los rendimientos es gaussiana.

El productor decide realizar una prueba sobre 9 parcelas, en las que pretende observar los rendimientos, promediarlos y de acuerdo al resultado optar o no por el nuevo producto: se acuerda correr un riesgo de rechazar el nutriente cuando en realidad éste cumple con las especificaciones promocionales, fijando para ello una probabilidad de error de 5%

Los resultados de las 9 parcelas fueron los siguientes: 2150, 1950, 2170, 1860, 2050, 2120, 1920, 1850, 2230.

¿Existe evidencia suficiente para decir que el nutriente aumenta los rendimientos?

**Solución.**

Es claro que $\mu_0=2000$, $\sigma=210$ y $\alpha=0.05$. Ahora, recordemos la filosofía de las pruebas de hipótesis: se busca evidencia de que $H_1$ es verdadera. Por lo tanto, $H_1$ en este caso $H_1:\mu>2000$ (es decir, los rendimientos promedios se van a mejorar). De esta manera, se plantea el test:

$$\left\{\begin{array}{l}H_0:\mu\le2000\\H_1:\mu>2000\end{array}\right.$$ con $\sigma$ conocida e igual a 210 y $\alpha=0.05$:

``muestra <- c(2150, 1950, 2170, 1860, 2050, 2120, 1920, 1850, 2230)
mu0 <- 2000
sigma  <- 210
alpha=0.05
z.test(muestra,alternative="great",mu=mu0,sigma.x=sigma,conf.level=1-alpha)``

**Conclusión:** La muestra nos arroja un $p$-valor de 0.317 e intervalo de confianza $(1918.194,\infty)$ al 95% de confianza. Como el $p$-valor es suficientemente grande y la media poblacional propuesta (=2000) se encuentra en el intervalo de confianza, tenemos evidencia estadística siginificativa para rechazar $H_1$: *con un 95% de confianza afirmamos que el nutriente no obtiene rendimientos medios superiores al valor usual*  


***
***
**Ejemplo 2**

Se desea contrastar con un nivel del 5% la hipótesis de que la altura media de los hombres de 18 o más años de un país es menor a 180cm. Se desconoce la desviación poblacional de las alturas, y se toma una muestra de 15 hombres dando como resultado 168, 168, 169, 167, 171, 172, 182, 175, 177, 173, 168, 195, 167, 175, y 175 (cm). ¿Existe evidencia de que la altura media de los hombres mayores de edad de este país es menor a 170?

**Solución.**

Es claro que $\mu_0=180$ y $\alpha=0.05$. Ahora, recordemos la filosofía de las pruebas de hipótesis: se busca evidencia de que $H_1$ es verdadera. Por lo tanto, $H_1$ en este caso $H_1:\mu<180$. De esta manera, se plantea el test:

$$\left\{\begin{array}{l}H_0:\mu\ge180\\H_1:\mu<180\end{array}\right.$$ con $\sigma$ desconocida y $\alpha=0.05$:

``muestra <- c(168, 168, 169, 167, 171, 172, 182, 175, 177, 173, 168, 195, 167, 175, 175)
mu0 <- 180
alpha=0.05
t.test(muestra,alternative="less",mu=mu0,conf.level=1-alpha)``

**Conclusión:** La muestra nos arroja un $p$-valor de 0.21 e intervalo de confianza $(-\infty,176.81)$ al 95% de confianza. Como la media poblacional propuesta (=180) no se encuentra en el intervalo de confianza, no tenemos evidencia estadística siginificativa para rechazar $H_1$ aun cuando el $p$-valor no es pequeño: *con un 95% de confianza afirmamos que la estatura media de los hombres mayores de edad es menor que 180cm en ese país.*  


***
***
**Ejemplo 3.**

En un estudio se afirma al menos 3 de cada 10 estudiantes universitarios trabajan. Pruebe esta aseveración, a un nivel de significación de 0.025, si una muestra aleatoria de 600 estudiantes universitarios revela que 200 de ellos trabajan.

**Solución.**

Es claro que $p_0=3/10=0.3$, $n=600$ y $x=200$, y $\alpha=0.025$. Ahora, recordemos la filosofía de las pruebas de hipótesis: se busca evidencia de que $H_1$ es verdadera. Por lo tanto, $H_1$ en este caso es $H_1:p>0.3$ (es decir, al menos el 30% de los estudiantes universitarios trabajan). De esta manera, se plantea el test:

$$\left\{\begin{array}{l}H_0:p\le0.3\\H_1:p>0.3\end{array}\right.$$ con $x=200$, $n=600$ y $\alpha=0.025$:

``p0 = 0.3
exitos = 200
tamano_muestra = 600
alpha=0.025
binom.test(x=exitos,n=tamano_muestra,p=p0,alternative="greater",conf.level=1-alpha)``

**Conclusión:** La muestra nos arroja un $p$-valor de 0.042 e intervalo de confianza $(0.295,1)$ al 97.5% de confianza. Como el $p$-valor es suficientemente grande y la proporción poblacional propuesta (=0.3) se encuentra en el intervalo de confianza, tenemos evidencia estadística siginificativa para rechazar $H_1$: *con un 97.5% de confianza afirmamos que no es verdad que al menos tres de cada 10 estudiantes universitarios trabajen*.  


***
***
**Ejemplo 4.**

Un fabricante de baterías garantiza que su producto dura en promedio 2.5 años con una desviación estándar de al menos 0.8 años (es decir, $\sigma>0.8$). Se sabe que la vida de uso de estas baterías sigue una distribución normal.

Se toma una muestra aleatoria de 8 baterías y resultó que la duración de cada una fue 2.32, 4.26, 4.02, 4.44, 3.68, 2.72, 1.90, 1.21 (años).

Con la evidencia tomada, ¿tiene razón el fabricante respecto a la desviación estándar poblacional? Utilice un 95% de confianza.

**Solución.**

Es claro que $\sigma_0=0.8$ y $\alpha=0.05$. Ahora, recordemos la filosofía de las pruebas de hipótesis: se busca evidencia de que $H_1$ es verdadera. Por lo tanto, $H_1$ en este caso es $H_1:\sigma>0.8$ (es decir, la desviación de la duración de la batería en años no es 0.8). De esta manera, se plantea el test:

$$\left\{\begin{array}{l}H_0:\sigma=0.8\\H_1:\sigma>0.8\end{array}\right.$$ con $\alpha=0.05$:

``muestra = c(2.32, 4.26, 4.02, 4.44, 3.68, 2.72, 1.90, 1.21)
sigma0 = 0.8
alpha=0.05
sigma.test(x=muestra,sigma=sigma0,alternative="greater",conf.level=1-alpha)``

**Conclusión:** La muestra nos arroja un $p$-valor de 0.02 e intervalo de confianza $(0.71,\infty)$ al 95% de confianza. Como la desviación poblacional propuesta (=0.8) se encuentra en el intervalo de confianza, aunque el $p$-valor no sea suficientemente grande, tenemos evidencia estadística siginificativa para rechazar $H_1$: *con un 95% de confianza afirmamos que no es verdad que la desviación poblacional de la duración de las pilas sea mayor que 0.8 años*.  
***
***

### Deducción de la prueba de hipótesis unilateral para la media poblacional de una población gaussiana  con desviación conocida

Sea $X$ una característica poblacional con distribución gaussiana, donde se desconoce la media $\mu$ pero se conoce la desviación $\sigma$. Fijemos $\mu_0$ y consideremos el contraste 

$$\left\{\begin{array}{l}H_0:\mu=\mu_0\\H_1:\mu>\mu_0\end{array}\right.$$

con una significancia $\alpha$. Tomemos una muestra aleatoria $X_1, X_2,...,X_n$ y definamos $Z$ como $Z=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}$. Nota que si $H_0$ es verdadera, entonces $Z$ es una gaussiana con media 0 y desviación 1.

Recordemos que buscamos evidencia de que $H_0$ no es verdadera, por lo cual si $\overline{X}$, la media muestral, es "bastante" mas grande que $\mu_0$, tendremos esa evidencia. En símbolos: si $\overline{X}>A$ para un cierto valor $A$ apropiado, rechazaremos $H_0$. 

Ahora bien, la definición de $\alpha$ nos dice $\alpha=P(\mbox{rechazar }H_0\mbox{ siendo verdadera})$, de donde $\alpha=P(Z>A)$, así que $1-\alpha=P(Z\le A)$, de modo que $A$ es el cuantil $1-\alpha$ de una normal estándar: $z_{1-\alpha}$ (lo que en **R** se calcula como $A$=``qnorm(1-alpha,1,0)``)

De esta manera: **Rechazamos $H_0$ si $Z>z_{1-\alpha}$**. Pero como $Z=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}$, lo anterior equivale a $$\overline{X}-z_{1-\alpha}\frac{\sigma}{\sqrt{n}}>\mu_0$$

Esto es: **Rechazamos $H_0$ si** $$\mu_0\in\left(\overline{X}-z_{1-\alpha}\frac{\sigma}{\sqrt{n}},\infty\right)$$
