# Pruebas de hipótesis

El objetivo principal de probar una hipótesis, es resolver la pregunta: **dada una muestra y un efecto aparente ¿cuál es la probabilidad de haber visto tal efecto por simple casualidad?**

De manera general, para resolver esta pregunta se puede seguir el siguiente camino:

1. Elegir una **hipótesis nula**, esta hipótesis es un modelo basado en el supuesto de que el efecto aparente no es real, por ejemplo, si creemos que los rendimientos de una acción son distintos de cero, entonces nuestra hipótesis nula sería que los rendimientos son cero.

2. Elegir una **estadística de prueba** con el fin de cuantificar el tamaño del efecto aparente.

3. Calcular el **p-value**, este valor es la probabilidad de ver valores más **extremos** a aquellos que vemos en nuestra muestra, bajo el supuesto de que la hipótesis nula es verdadera.

4. Si el **p-value** es *pequeño*, el efecto es considerado **estadísticamente significativo**, es decir, es poco probable que haya ocurrido por casualidad.

**Definición(Hipótesis)**

Una hipótesis es un enunciado acerca de un parámetro desconocido $\theta$.


Suponga que se tiene que elegir entre dos hipótesis 

$$
H_0: \theta \in \Theta_0 \text{ vs. } H_1: \theta \in \Theta_1
$$
en donde $\Theta_0 \cap \Theta_1 = \emptyset$. Con base en una muestra $x1,\ldots,x_n$ se trata de elegir la hipótesis que parece más razonable. La hipótesis $H_0$ es llamada **hipótesis nula** mientras que la hipótesis $H_1$ se conoce como **hipótesis alternativa**.

**Definición(Hipótesis simples y compuestas)**

Una hipótesis es **simple** si especifíca completamente la función de densidad, en otro caso es llamada **compuesta**.

Por ejemplo 

$$
H_0: \theta = \theta_0 \text{ y } H_1: \theta = \theta_1
$$
son ambas hipótesis simples. En cambio

$$
H_0: \theta > \theta_0 \text{ y } H_1: \theta < \theta_1
$$
son ejemplos de hipótesis compuestas.

**Tipos de errores**

La siguiente tabla ilustra los tipos de errores que se pueden cometer al elegir entre las hipótesis.

|Decisión|Verdad|        |
|--------|------|--------|
|        |$H_0$ Verdadero|$H_1$ Verdadero|
|Aceptar $H_0$| No hay error | Error del tipo $II$|
|Aceptar $H_1$| Error del tipo $I$ | No hay error|

La hipótesis $H_0$ se rechaza siempre que los valores observados de la muestra, $\mathbf{x}$, pertencen a la región de rechazo $\mathcal{R}$. Tenemos así lo siguiente

$$
\alpha = \mathbb{P}(\text{Erro tipo I}) = \mathbb{P}(x\in\mathcal{R} \text{ cuando } H_0 \text{ es verdadera})
$$
$$
\beta = \mathbb{P}(\text{Erro tipo II}) = \mathbb{P}(x\in\mathcal{R}^c \text{ cuando } H_1 \text{ es verdadera})
$$

**Ejercicio**

Suponga se extrae una muestra de dos variables $N(\theta,1)$ y se definen las hipótesis $H_0:\theta = 5.5$ y $H_1:\theta = 8$. Utilizando la región de rechazo

$$
\mathcal{R} = \{ (X_1,X_2): \dfrac{1}{2}(X_1 + X_2) > 7 \}
$$
calcule a través de simulación la probabilidad del error del tipo $I$ y $II$. Compare sus resultados con la solución analítica.

**Nota**

* No puede utilizar cíclos.
* Utilice 1e6 simulaciones.
* Exprese con 4 decimales.
* Semila 54321


In [None]:
import numpy as np
from scipy.stats import norm
np.random.seed(54321)

#número de simulaciones
n_sim = int(1e6)

#simulaciones bajo H0
sim_h0 = norm.rvs(size = (n_sim,2), loc = 5.5, scale = 1)

#simulaciones bajo H1
sim_h1 = norm.rvs(size = (n_sim,2), loc = 8, scale = 1)

#Estima probabilidad del error del tipo I
alfa_estim = np.sum((0.5*(sim_h0[:,0] + sim_h0[:,1])) > 7)/n_sim

#Estima la probabilidad del error del tipo II
beta_estim = np.sum((0.5*(sim_h1[:,0] + sim_h1[:,1])) <= 7)/n_sim

#Valores exactos
#utilizando la distribucion de (1/2)*(x1 + x2)
alfa_ex = 1 - norm.cdf(x = 7, loc = 5.5, scale = np.sqrt(0.5))
beta_ex = norm.cdf(x = 7, loc = 8, scale = np.sqrt(0.5))

print('Error tipo I aproximado', np.round(alfa_estim,4))
print('Error tipo I exacto', np.round(alfa_ex,4))
print('Error tipo II aproximado', np.round(beta_estim,4))
print('Error tipo II exacto', np.round(beta_ex,4))


**Definición(Función potencia)**

Sea $\mathcal{R}$ una región de rechazo, la función potencia de una prueba se define como

$$
Q(\theta) = \mathbb{P}_{\theta}(\mathcal{R})
$$

en el caso de hipótesis simples, se tiene $Q(\theta_0)=\alpha$ y $Q(\theta_1)=1 -\beta$.

**Definición(Función crítica o de prueba)**

La función $\psi(.): \mathcal{X}^n \rightarrow [0,1]$ que denota la probabilidad de rechazar $H_0$ cuando se observa $\mathbf{X}=\mathbf{x}$.

**Definición(Tamaño de una prueba)**

Sea $\alpha \in (0,1)$. Se dice que una prueba para $H_0: \theta \in \Theta_0 \text{ vs. } H_1: \theta \in \Theta_1$ con su función potencia $Q(\theta)$, es de tamaño $\alpha$ si

$$
\max_{\theta \in \Theta_0}Q(\theta) = \alpha
$$


**Definición(Nivel de un prueba)**

Sea $\alpha \in (0,1)$. Se dice que una prueba para $H_0: \theta \in \Theta_0 \text{ vs. } H_1: \theta \in \Theta_1$ con su función potencia $Q(\theta)$, es de nivel $\alpha$ si

$$
\max_{\theta \in \Theta_0}Q(\theta) \leq \alpha
$$

**Definición(Prueba uniformemente más potente)**

Sea $\mathcal{C}$, la colección de todas las pruebas de nivel $\alpha$ para $H_0: \theta \in \Theta_0 \text{ vs. } H_1: \theta \in \Theta_1$. Una prueba que pertenece a $\mathcal{C}$ con su función potencia $Q(\theta)$ se dice que es la prueba **uniformemente más potente** con nivel $\alpha$ si y sólo si $Q(\theta) \geq Q^{*}(\theta)$ para todo $\theta \in \Theta_1$ y $Q^{*}$ es la función potencia de cualquier otra prueba en $\mathcal{C}$.

En otras palabras, la prueba uniformemente más potente, comete un error del tipo $I$ menor o igual a $\alpha$ y tiene el error del tipo $II$ más pequeño entre aquellas pruebas de nivel $\alpha$.

**Definición(P-value)**

Suponga que se tiene una estadística de prueba $T$ y que se calcula su valor, $T=t$, utilizando una muestra $\mathbf{x}$. El **p-value** se define como la probabilidad de observar datos más *extremos* si $H_0$ es verdadera.

Si la hipótesis alternativa es $\theta > \theta_0$, esto quiere decir $\mathbb{P}(T > t | H_0 \text{ verdadero})$, mientras que si la hipótesis alternativa es $\theta < \theta_0$, el p-value es $\mathbb{P}(T < t | H_0 \text{ verdadero})$

**Ejercicio**

Obtenga una muestra $X_1,\ldots,X_{15}$ de una distribución $N(\mu = 5,\sigma^2 = 9)$. Estime el p-value para la siguiente prueba

$$
H_0: \mu_0 = 3.1 \text{ vs } H_1: \mu > \mu_0 
$$

Como estadística $T$ utilice

$$
\dfrac{\sqrt{15}\left( \bar{X} - \mu_0 \right)}{\sigma}
$$

In [None]:
import numpy as np
from scipy.stats import norm
np.random.seed(54321)

#número de simulaciones
n_sim = int(1e5)

#size muestra
size_muestra = 15

#sigma
sig = 3

#mu
mu_0 = 3.1
mu_1 = 5

#valores observados
#y aplica la transformación de la estadística
obs = norm.rvs(size = size_muestra, loc = mu_1, scale = sig)
obs = np.sqrt(size_muestra)*(np.mean(obs) - mu_0)/sig

#Simula suponiendo H_0 verdadera
#después aplica la transformación de la estadística
sim = norm.rvs(size = (n_sim, size_muestra),
                     loc = mu_0, scale = sig)
sim = np.sqrt(size_muestra)*(np.mean(sim, axis = 1) - mu_0 )/sig

#Calcula p-value
p_value = np.sum(sim > obs) / n_sim
p_value

# Intervalos de confianza

**Definición(Pivote)**

Un pivote, es una variable aleatoria $U$ la cual involucra una estadística suficiente $T$ y el párametro $\theta$ que se busca estimar. A pesar de incluir a $\theta$ en su cálculo, la distribución de $U$ no depende de el.

**Intervalo de confianza para la media (Caso normal con $\mu$ desconocida y $\sigma$ conocida)**

Suponga que $X_1, \ldots, X_n$ es una muestra de una distribución $N(\mu, \sigma^2)$ con $\mu$ desconocida y $\sigma$ conocida. Fije un número $\alpha \in (0,1)$. Para construir un intervalo de confianza del $(1 - \alpha)\%$ se realiza lo siguiente.

Es posible demostar (utilizando la factorización de Neyman) que la estadística $\bar{X}$ es una estadística suficiente para $\mu$. Además, se sabe que esta estadística tiene distribución $N(\mu, \dfrac{1}{n}\sigma^2)$. Como pivote, se utiliza la estadística $\dfrac{\sqrt{n}(\bar{X} - \mu)}{\sigma}$ la cual tiene distribución $N(0,1)$ (observe que aún cuando $U$ involucra el parámetro desconocido $\mu$, su distribución no depende de este).

Si denotamos como $z_{\tfrac{\alpha}{2}}$ al número tal que, para $Z \sim N(0,1)$ se tiene que $\mathbb{P}(Z > z_{\tfrac{\alpha}{2}}) = \tfrac{\alpha}{2}$ y utilizando la simetría de la distribución normal, se tiene que

$$
\mathbb{P}\left(-z_{\tfrac{\alpha}{2}} < U < z_{\tfrac{\alpha}{2}} \right) = 1 - \alpha
$$

realizando un poco de álgebra se tiene que

$$
\mathbb{P}\left(\bar{X} -z_{\tfrac{\alpha}{2}}n^{-\tfrac{1}{2}} < \mu < \bar{X} + z_{\tfrac{\alpha}{2}}n^{-\tfrac{1}{2}} \right) = 1 - \alpha
$$

y por lo tanto, un intervalo de $(1 - \alpha)\%$ confianza para $\mu$ es

$$
\left(\bar{X} -z_{\tfrac{\alpha}{2}}n^{-\tfrac{1}{2}} , \bar{X}  + z_{\tfrac{\alpha}{2}}n^{-\tfrac{1}{2}} \right)
$$

**Nota**

Para encontrar el valor de $z_{\tfrac{\alpha}{2}}$ se puede realizar lo siguiente.

Suponga que $Z \sim N(0,1)$, entonces se tiene que 

$$
\mathbb{P}\left(Z > z_{\tfrac{\alpha}{2}}\right) = \tfrac{\alpha}{2}
$$

Lo que es equivalente a 

$$
1 - \mathbb{P}\left(Z \leq z_{\tfrac{\alpha}{2}}\right) =\tfrac{\alpha}{2}
$$

es decir

$$
\mathbb{P}\left(Z \leq z_{\tfrac{\alpha}{2}}\right) = 1 - \tfrac{\alpha}{2}
$$

Si $F$ denota la función de distribución acumulada de $Z$, entonces

$$
F\left(z_{\tfrac{\alpha}{2}}\right) = 1 - \tfrac{\alpha}{2}
$$

y por lo tanto

$$
z_{\tfrac{\alpha}{2}} = F^{-1}\left( 1 - \tfrac{\alpha}{2} \right)
$$

En donde $F^{-1}$ es la función inversa de la función de distribución acumulada.