## **Pruebas de hipótesis**

Tanto en la estimación puntual como en la estimación por intervalo nuestro interés era extraer toda la información que contenía la muestra respecto al parámetro. Es decir asumíamos total ignorancia frente al verdadero valor del parámetro y usábamos los datos para construir una estimación. En las pruebas de hipótesis los investigadores tienen una creencia o una aseveración acerca del parámetro (*antes de recoger o de analizar los datos*) y quieren corroborar si esa creencia es soportada por los datos o no. Unos ejemplos de una hipótesis podría ser "el salario promedio de los colombianos supera 250 dolares" o "la población colombiana que vive en estrato 1 es a lo sumo el 15% de la población total".



### Sistema de hipótesis
Vamos a definir la hipótesis como una afimación acerca del valor real de uno o varios parámetros de la población.

#### **Definición sistema de hipótesis**
Dado el conjunto de posibles valores $\Theta$ del parámetro $\theta$, un sistema de hipótesis consiste en dos hipótesis, denominada **hipótesis nula** ($H_0$) e **hipótesis alternativa** ($H_1$), tales que: 

$$
\begin{cases}
H_0 \ : \ \theta \in \Theta_0 \\
vs (\text{versus}) \\
H_1 \ : \ \theta \in \Theta_1 \\
\end{cases}
$$

con 

- $\emptyset \subset \Theta_0,\Theta_1$ 
- $\Theta_0,\Theta_1 \subset \Theta$
- $\Theta_0 \cup \Theta_1 = \Theta$
- $\Theta_0 \cap \Theta_1 = \emptyset$

($\Theta_0$ y $\Theta_1$ una partición de $\Theta$)

#### Ejemplo (introductorio)
Un estanque  es visitado diariamente por patos para actividades de alimentación, reproducción y esparcimiento. Se asume que el número de patos que visitan el estanque un día cualquiera, $X$, sigue una distribución Poisson ($X \sim P(\theta)$). Es de interés para los biólogos conocer el valor del parámetro $\theta$.

- Los biólogos tienen conocimiento de que el número promedio de patos que visitan el estanque es 2 o 4.

Supongan que contratan a un estadístico el cual solamente toma una observación. El día que la toma observa que hay $x=3$ patos. ¿Qué valor sería razonable para el parámetro y por qué?.

***Solución:***
Teniendo en cuenta las suposiciones de los biólogos $\Theta = \{ 2,4 \}$ de este modo, en principio, dejamos el sistema de hipótesis 

$$
\begin{cases}
H_0 \ : \ \theta \in \Theta_0=\{2\} \\
vs (\text{versus}) \\
H_1 \ : \ \theta \in \Theta_1=\{4\} \\
\end{cases}
$$

> Como estamos haciendo un ejemplo ilustrativo dejamos que el sistema de hipótesis de esta manera, pero es importante tener en cuenta que podría quedar con la hipótesis nula como el conjunto cuyo único valor es 4

Dado lo visto hasta ahora  podemos ver que, dado el estimador por analogía de una muestra aleatoria con distribución Poisson ($\bar{X}_n$), tenemos que el valor del parámetro es tres lo  cual no nos permite ser concluyentes hacia cual hipótesis está favoreciendo la observación.

También  si vamos a hacer una estimación por intervalo veamos que podríamos tener casos donde tampoco podríamos ser concluyentes. Los casos podrían ser aquellos intervalos que contengan ambos valores del parámetro, o aquellos que no contengan a ninguno y estén definidos entre 2 y 4. Los casos donde podríamos sacar una conclusión sobre la hipótesis son aquellos donde el intervalo  contiene a un valor del parámetro o donde el intervalo esta a la izquierda de 2 o a la derecha de 4.

Extendiendo un poco los conocimientos que hemos desarrollado en el curso pensemos por un momento en la función de máxima verosimilitud. Es decir que para $\hat{\theta}_{\text{MLE}} = \operatorname{arg max}_{\Theta} L(\theta|\mathbf{x})$ vemos que $p[X=3 | \theta]$ nos deja que 

$$
p[X=3 | \theta=2] = L(\theta=2 | \mathbf{x} = 3) = 0.1804
$$
$$
p[X=3 | \theta=4] = L(\theta=4 | \mathbf{x} = 3) = 0.1953
$$

Por lo tanto lo que estamos diciendo es que vamos a ver,  en probabilidad siendo el valor del parámetro 2 o 4, donde se ve más favorecida la  ocurrencia de 3. Esto se explicará mas a detalle durante el desarrollo de este tema.
    
> A pesar que le resultado está favoreciendo la hipótesis alternativa, vamos a ver más a delante que tenemos que cumplir más criterios si pretendemos adoptar la hipótesis alternativa.

#### ¿Por qué se necesita un sistema de hipótesis?

- Porque, al igual que en un sistema judicial se tienen dos decisiones inocente o culpable, la evidencia debería decidir cual de dos opciones es más cercana a la realidad.

- También, siguiendo la misma analogía del del sistema judicial, como una  persona debe ser inocente hasta que se pruebe lo contrario, en estadística la hipótesis nula es la que se asume como cierta a menos que los datos evidencien de forma contundente (más adelante veremos que significa de forma contundente) lo contrario.

> Volviendo al ejemplo ilustrativo anterior, considera que la diferencia entre $p[X=3 | \theta=2] = L(\theta=2 | \mathbf{x} = 3) = 0.1804$ y $p[X=3 | \theta=4] = L(\theta=4 | \mathbf{x} = 3) = 0.1953$ es contundente ?

### **Test de hipótesis o juzgamiento de hipótesis**

#### **Definición de test de hipótesis**
La definición de test de hipótesis es una regla basada en una estadística que especifica:

1. Para qué valores de la estadística, la decisión es **no rechazar** (*aceptar*) la hipótesis nula $H_0$.

2. Para qué valores de la estadística, la decisión es **rechazar** la hipótesis nula $H_0$ y aceptar la hipótesis alternativa $H_1$ como  cierta.

- En la práctica se suele escribir algo como "Rechazar la hipótesis nula en favor de la alternativa si [...]

- Es importante, como siempre dejar en claro que, si se pudiese hacer un censo, se determinaría con exactitud cuál de las dos hipótesis es cierta. Y ya sabemos que en la mayoría de casos eso puede llegar a ser una tarea titánica.

#### **Definición de región de rechazo**
Basados en una estadística de test (o juzgamiento), $W(\mathbf{X})$, y habiendo definido qué tipo de evidencia se debe observar para rechazar $H_0$, se define la **región de rechazo del sistema de hipótesis** a 

$$
\mathbf{R} = \left\{ (x_1,x_2, \cdots, x_n) \in \mathbb{R}^n \ : \ W(\mathbf{x} \in B) \right\}
$$

donde $B$ es la evidencia para rechazar $H_0$.

- En este curso estudiaremos **test no aleatorizados**, es decir, si los datos caen sobre la región de rechazo, se rechazará la hipótesis nula.

- Hay otros test llamados **test no aleatorizados** en los que la información de la muestra es usada para determinar una probabilidad de rechazo y la decisión final depende de la simulación de un resultado de naturaleza Bernoulli.

Veamos que gráficamente sobre $\mathbb{R}^n$ podríamos representar la región de rechazo en rojo como
![](https://cdn.mathpix.com/snip/images/RWaBnVJT0-tTmrOJtQF_7wPVXCnYb2gHr5lKPmfIo1k.original.fullsize.png)

#### Ejemplo (introductorio a una región de rechazo)
Siguiendo el ejemplo de los patos un test de hipótesis es más o menos de la forma 

Sea $X \sim P(\theta)$ : Número de patos que visitan un estanque en un día"

$$
\begin{cases}
H_0 \ : \ \theta \in \Theta_0=\{2\} \\
vs \Theta=\{2,4\} \\
H_1 \ : \ \theta \in \Theta_1=\{4\} \\
\end{cases}
$$

$\tau$ : "Rechazar $H_0$ en favor de $H_1$ si $x \geq 3$" 

- Podemos  ver que la región de rechazo, como  se dice explícitamente son los valores donde el valor del parámetro esta entre algún numero mayor o igual a 3. Entonces la región de aceptación son los valores del parámetro menores a 3.

- Si tenemos que el valor del parámetro es $x=3$ entonces rechazamos la hipótesis nula $H_0$ y adoptamos que el valor del parámetro es 4.

> Veremos más adelante como se contruyó este test de hipótesis.

### **Sistemas de hipótesis usualmente usados en estadística**
Los sistemas de hipótesis podrán construirse de la manera que se desee,  en principio, siempre y cuando se respeten las características anteriormente dichas. Sin embargo, hay tres que suelen usarse a menudo.

#### Sistemas de hipotesis mas usuales
Dado un parámetro $\theta$ de interés, los siguientes sistemas son los más usasdos.

- **Sistemas a dos colas**

$$
\begin{cases}
H_0 \ : \ \theta = \theta_0 \\
vs  \\
H_1 \ : \ \theta \neq \theta_0 \\
\end{cases}
$$

- **Sistema con cola a derecha**

$$
\begin{cases}
H_0 \ : \ \theta \leq (=) \theta_0 \\
vs  \\
H_1 \ : \ \theta > \theta_0 \\
\end{cases}
$$

- **Sistema con cola a izquierda**

$$
\begin{cases}
H_0 \ : \ \theta \geq (=) \theta_0 \\
vs  \\
H_1 \ : \ \theta < \theta_0 \\
\end{cases}
$$

> Tengamos en cuenta que en estos casos usuales la igualdad está sobre la hipótesis nula.

#### Ejemplo
![](https://cdn.mathpix.com/snip/images/W5dJjp5AHOMFeU9XZHrSICE-wfffFimwta8O-rLUm6k.original.fullsize.png)

### No todo es color "rosa"
Cuando dependemos de una muestra para tomar una desición, hay sin lugar a duda, cabida para que haya errores

![](https://cdn.mathpix.com/snip/images/I5Q-DO1D3ZR2zlc6_pQbhhiGrbIXe6k3I2MZWUZ2418.original.fullsize.png)

- Tengamos en cuenta que, aunque no podemos conocer la realidad a precisión o lo que va a suceder precisamente en el futuro, si podemos construir un test que limite la posibilidad de cometer errores

$$
p(\text{Error tipo I})=p\left( \text{Rechazar}H_{0} \mid H_{0} \text{es cierta} \right)=\alpha
$$
$$
p(\text{Error tipo II})=p\left( \text{Aceptar}H_{0} \mid H_{0} \text{es falsa} \right)=\beta
$$

- La probabilidad de cometer un error de tipo 1 se llama **significancia del test** y se expresa en porcentajes (con valores usuales de $1\%$, $5\%$ o $10\%$) y al igual que en intervalos de confianza no es plausible fijar el valor en $0\%$.

- También no es posible controlar ambos tipos de error, así que sólo se controla la *significancia* (por considerarlo  un error más grave). La única manera de reducir ambos errores es aumentando el tamaño de muestra.

> Es importante tener en cuenta que la notación de $\alpha$ y $\beta$ no debe sugerir que en todo caso $\alpha + \beta = 1$ dado que es falso. Lo que si es cierto es que $\alpha + p\left( \text{Aceptar}H_{0} \mid H_{0} \text{es cierta} \right) = 1$ puesto que si son eventos complementarios.

> Pensemos por un momento tambié n que esperar una significancia del $0\%$ tendría como consecuencia que nunca se rechazar la hipótesis nula a favor de la alternativa. Lo cual podríamos pensar por un momento no es nada útil si pensamos en el test como una prueba de embarazo la cual siempre da positiva,luego ésta no falla a  la hora de decirnos que las mujeres embarazadas estan de hecho embarazadas, pero si nos diría que las mujeres que no están embarazadas también lo están.


### Ejemplo 
Un laboratorio farmacéutico está trabajando en encontrar un medicamento que ayude a los pacientes con diabetes a reducir sus niveles de azúcar en sangre, Para ello, deciden tomar una muesra de 50 pacientes diabéticos, medirles su nivel de azúcar antes y después del tratamiento, y estudiar las diferencias.

- ¿Cuál es el parámetro de interés en este caso?

Solución: $\mu_D$ :"El promedio de las diferencias en el nivel de azúcar (después - antes)". Sabemos que en este caso que, si $\mu_D$ es un valor negativo, entonces podríamos decir que en efecto el medicamento disminuye el nivel de azúcar en la sangre. 

- ¿Cuál sería el sistema de hipótesis de interés para el laboratorio?

Solución: la creencia como tal, o lo que le interesa ver al laboratorio es si en realidad el medicamento permite bajar el nivel de azúcar en la sangre, por lo que un medicamento que tentativamente lo deje igual seria meramente un placebo y uno que por el contrario aumente el nivel de azúcar es en realidad algo contraproducente. De este modo teniendo en cuenta que la igualdad es aquella que debería estar en la hipótesis nula tenemos que $H_0$: "El medicamento mantiene o aumenta los niveles de azúcar" y $H_1$: "El medicamento disminuye los niveles de azúcar en la sangre.

- Si desean hacer un test con una significancia del 5%, ¿Cómo se interpretaría el error tipo I en este test?

Solución: En palabras es que, el error tipo I es que en promedio se reduce el nivel de azúcar en la sangre cuando en realidad en promedio deja igual o aumenta el nivel de azúcar

- ¿Se puede calcular el error tipo II con esta información? ¿Cómo se interpretaría el error tipo II en este contexto?

Solución: En palabras es que, el medicamento no es efectivo cuando en realidad lo es.

> Cúal de los dos errores es más grave?

### Ejemplo 5

Sea $X \sim P(\lambda)$ : Número de patos que visitan el estanque en un día"

$$
\left\{\begin{split}{l}
\mathrm{H}_{0}: \theta = 2 \\
\text { versus } \\
\mathrm{H}_{1}: \theta=4
\end{split}\right. \text {, }
$$

 $\Theta = \{2,4\}$

$\tau:$ "Rechazar $\mathrm{H}_{0}$ en favor de $\mathrm{H}_{1}$ si $\mathrm{x} \geq 3^{\prime \prime} \rightarrow$ "No sabremos de donde viene".

¿Cuáles son las probabilidades de error tipo I y de error tipo II en este caso para el test?

![](https://cdn.mathpix.com/cropped/2022_01_28_c5496d3a28db0a918d59g-09.jpg?height=182&width=660&top_left_y=788&top_left_x=388)


***Solución:***

$$
\begin{split}
p[\text{Error tipo I}] 
& = p[\text{Rechazar }H_0 | H_0\text{ es cierta}] \\
& = p[X \geq 3 | \theta = 2] \\
& = p[X_{\theta = 2} \geq 3] \\
& = 1 - p[X_{\theta = 2} = 0] - p[_{\theta = 2} = 1] - p[X_{\theta = 2} =2] \\
& = 0.3233
\end{split}
$$

La interpretación que podríamos dar del resultado es que de cada 100 veces que $H_0$ es cierta en aproximadamente 32 la rechazaríamos incorrectamente.

$$
\begin{split}
p[\text{Error tipo II}] 
& = p[\text{Aceptar }H_0 | H_1\text{ es cierta}] \\
& = p[X < 3 | \theta = 4] \\
& = p[X_{\theta = 4} \leq 2] \\
& = 0.2381
\end{split}
$$

De cada 100 veces que $H_1$ es cierta, en aproximadamente 24 veces aceptamos $H_0$ de manera equivocada

### **Función de potencia de un test**

#### **Definición: Función de potencia**

La función de potencia de un test, $\tau$  se define como:

$$
\pi_{\tau}(\theta)=\mathrm{p}_{\theta}[\mathbf{X} \in \mathbf{R}(\tau)], \theta \in \Theta
$$ 

> notemos que $\mathbf{X} \in \mathbf{R}(\tau)$ no es más que rechazar $H_0$

Esta está relacionada con la probabilidad de error tipo $\mathrm{I}$, si $\theta \in \mathrm{\Theta}_{0}$, y con 1- probabilidad de error tipo II, si $\theta \in \Theta_{0}^{c}=\Theta_{1}$

#### **Definición: Curva característica de operación (CO)**

La curva CO de un test se define como:

$$
\beta_{\tau}(\theta) = 1-\pi_{\tau}(\theta) = 1-\mathbf{p}_{\theta}[\mathbf{X} \in \mathbf{R}(\tau)] \quad ,  \quad \theta \in \Theta
$$


#### Ejemplo 6

Considere el siguiente sistema de hipótesis para $\theta \in \Theta=\mathbb{R}$.

$$
\begin{cases}
\mathrm{H}_{0}: \theta=0.5 \\
\text { versus } \\
\mathrm{H}_{1}: \theta \neq 0.5
\end{cases}
$$

¿Cuál sería la función de potencia ideal para este sistema? ¿Cuál sería la curva CO?

***Solución:***

Tenemos que 

$$
\pi_{\tau} (\theta) = p[\text{Rechazar }H_0 | \theta] : \theta \in \Theta
$$

donde

$$
\Theta_0 = \{0.5\}
$$

y

$$
\Theta_{1} = \mathbb{R} - \{0.5\}
$$

De este modo vemos que

$$
\begin{split}
& \pi_{\tau}(\theta)=p[\text{Rechazar }H_0 | \theta]  ; \theta \in \Theta \\
& = \begin{cases}
    p(\text { Enrortipo I }) & ,\theta \in \Theta_{2} \quad (H_0) \\
    1 - p(\text{ Aceptar }H_0 | \theta) = 1 - p[\text{ Error tipo II }] & , \theta \in \Theta \quad (H_1) \\
    \end{cases}
\end{split}
$$

donde esperamos que $p[\text{ Error tipo II }]$ sea lo suficientemente cercano a 1

$$
\begin{cases}
\mathrm{H}_{0}: \theta=0.5 \\
\text { versus } \\
\mathrm{H}_{1}: \theta \neq 0.5
\end{cases}
$$

¿Cuál es la función de potencia ideal?

![](https://cdn.mathpix.com/snip/images/z9dugeYMEZ9gK3JLkfiiq9JUJ24bi6y2aUySijRyC74.original.fullsize.png)

#### Ejemplo 6

Considere el siguiente sistema de hipótesis para 

$$
\theta \in \Theta=\mathbb{R}
$$
$$
\begin{cases}
    \mathrm{H}_{0}: \theta=0.5 \\
    \text { versus } \\
    \mathrm{H}_{1}: \theta \neq 0.5
\end{cases}
$$

![](https://cdn.mathpix.com/snip/images/NmFJ5K5tZhUsnVkwm4WizrVTlLUh_F_DcBNaB-7j0lM.original.fullsize.png)

- Las funciones de potencia en general lucen más como la de la imagen.

- ¿Cómo podremos definir que un test es mejor que otro?

### **Tamaño o nivel del test**

#### **Definición Tamaño o nivel del test**

Para $0 \leq \alpha \leq 1$, un test con función de potencia $\pi_{\tau}(\theta)$ es un test de tamaño $\alpha$ si:

$$
\operatorname{sup}_{\theta \in \Theta_{0}} \pi_{\tau}(\theta)=\alpha
$$

En el caso de nivel para $0 \leq \alpha \leq 1$, un test con función de potencia $\pi_{\tau}(\theta)$ es un test de nivel (v.a discretas) $\alpha$ si:

$$
\operatorname{sup}_{\theta \in \Theta_{0}} \pi_{\tau}(\theta) \leq \alpha
$$

> Esto porque en ocasiones el supremo cae fuera de los valores discretos

- Se habla de nivel cuando la estadística en la cual está basado el test es una variable aleatoria discreta.

- Lo que se busca con esto es controlar la probabilidad de error tipo I. $\alpha$ suele llamarse la **significancia** o en el caso de nivel **significación** del test.

$$
\text { Error tipo II} = \beta = \operatorname{sup}_{\theta \in \Theta_{1}} \left( 1-\pi_{\tau}(\theta) \right) =\operatorname{inf}_{\theta \in \Theta} \pi_{\tau}(\theta)
$$

#### Ejemplo 7

Sea $X \sim \operatorname{Bin}(5, \theta)$. Considere el sistema y los tests:

$$
\begin{cases}
H_0 : \theta \leq \frac{1}{2} \\
\text{ versus } \\
H_1 : \theta > \frac{1}{2}
\end{cases}
$$

- $\tau_{1}$ : Rechazar ${H}_{0}$ en favor de ${H}_{1}$ si ${x}=5$".
- $\tau_{2}$ : Rechazar ${H}_{0}$ en favor de ${H}_{1}$ si ${x}\geq 3$".

- ¿Cuáles son las funciones de potencia de cada uno?

- ¿Cuál es el nivel de cada uno?

- En conclusión, ¿puede decirse que uno de los dos sea mejor? 

***Solución:***

Para $\tau_1$

$$
\pi_{\tau_{1}}(\theta) = p\left[\text { Rechazar } H_{0}\right] = p[X=5]= \binom{5}{5}\theta^5(1-\theta)^5 = \theta^5
$$

Para$\tau_{2}:$

$$
\pi_{\tau_{2}}(\theta) = p[\text { Rechazar } H_0] = p[X \geq 3]= p_{X}(3)+p_{X}(4)+p_{X}(5) = 10 \theta^{3}(1-\theta)^{2}+5 \theta^{4}(1-\theta)+\theta^{5}
$$

![](https://cdn.mathpix.com/snip/images/wMK_hpvURxYyQ5IlHOn6qqbYGy8VaCAy2iZBEEPR8aI.original.fullsize.png)

Nivel de $\tau_1 : \operatorname{sup}_{\theta \in \Theta_0} \pi_{\tau_1}(\theta)= \left( \frac{1}{2} \right)^5 \approx 0.0312$ (probabilidad de cometer error tipo I)

Nivel de $\tau_2 : \operatorname{sup}_{\theta \in \Theta_0} \pi_{\tau_2}(\theta)= \left( 16\frac{1}{2} \right)^5 \approx 0.4992$ (probabilidad de cometer error tipo I)

donde podemos ver que $\tau_1$ es el que comete menor error de tipo I. En términos de error de tipo II tenemos que $\tau_2$ es  más potente.

### ¿Y ahora?

- ¿Cómo se construye un test basado en una estadística?

- ¿Cómo se fija el valor de la significancia y cómo impacta esa decisión?

- ¿Qué podrá encontrar el "mejor" test para un determinado sistema? Métodos de construcción de tests 

### **Método de razón de verosimilitudes**

1. Método de razón de verosimilitudes (LRT):
Sea $\mathbf{X}=(X_1,X_2,\cdots,X_n)$ un vector aleatorio parametrizado por $\theta$. Condidere el sistema:

$$
\begin{cases}
H_0 & \theta \in \Theta_0 \\
\text{versus} \\
H_1 & \theta \in \Theta_0^c
\end{cases}
$$

- Estadística 
$$
\lambda(\mathbf{x}) = \frac{\operatorname{sup}_{\theta \in \Theta_0} L(\theta | \mathbf{x})}{\operatorname{sup}_{\theta \in \Theta} L(\theta | \mathbf{x})}
$$
donde podemos ver que dadas las restricciones para $\theta$ ($\theta \in \Theta_0$ y $\theta \in \Theta$) tenemos que el valor de la estadística es tal que $0 \leq \lambda(\mathbf{x}) \leq 1$

El test $\tau$: "Rechazar $H_0$ en favor de $H_1$ si $\lambda(\mathbf{x} \leq c$)" es un LRT. El valor de $x$ se determina de modo que el test tenga la significancia deseada.

#### Ejemplo 8

Para $\mathrm{X}_{1}, \mathrm{X}_{2}, \ldots, \mathrm{X}_{\mathrm{n}}$ una muestra aleatoria $\mathrm{N}\left(\theta, \sigma^{2}\right)$ con $\sigma^{2}$ conocido, determine el LRT (likehood ratio test) de significancia $100 \cdot \alpha \%$ para el sistema:

$$
\begin{cases}
\mathrm{H}_{0}: \theta=\theta_{0} \\
\text { versus } \\
\mathrm{H}_{1}: \theta \neq \theta_{0}
\end{cases}
$$

donde $\theta_{0}$ es un valor prefijado por el investigador. 

***Solución:***

Tenemos un test a dos colas el cual podemos reescribir de la siguiente manera

$$
\begin{cases}
\mathrm{H}_{0}: \theta=\theta_{0}  & \Theta_0 = \{\theta_0\} \\
\text { versus } & \Theta = \mathbb{R} \\
\mathrm{H}_{1}: \theta \neq \theta_{0} & \Theta_1 = \mathbb{R}- \{\theta_0\} \\
\end{cases}
$$

- Luego, recordando que nuestra estadística debe ser:
$$
\lambda(\mathbf{x}) = \frac{\operatorname{sup}_{\theta \in \Theta_0} L(\theta | \mathbf{x})}{\operatorname{sup}_{\theta \in \Theta} L(\theta | \mathbf{x})}
$$

y que nuestra función de verosimilitud es

$$
L(\theta|\mathbf{X}) = (2\pi)^{\frac{n}{2}} \sigma^{-n} \exp{\left[ \frac{-1}{2\sigma^2} \sum_{i=1}^{n} (x_i - \theta)^2 \right]}
$$

tenemos, dado que solo tenemos un valor entre $\Theta_0$, que el valor más grande alcanzado es con $\theta_0$  entonces

$$
\begin{split}
\operatorname{sup}_{\theta \in \Theta_0} L(\theta | \mathbf{X}) 
& = L(\theta_0 | \mathbf{X}) \\
& = (2\pi)^{\frac{n}{2}} \sigma^{-n} \exp{\left[ \frac{-1}{2\sigma^2} \sum_{i=1}^{n} (x_i - \theta_0)^2 \right]}
\end{split}
$$

y 

$$
\begin{split}
\operatorname{arg sup}_{\theta \in \Theta} L(\theta | \mathbf{X})
& = \hat{\theta}_{\text{MLE}} \\
& = \bar{X}_n
\end{split}
$$

> tengamos en cuenta que $\operatorname{sup}_{\theta \in \Theta} L(\theta | \mathbf{X})$ es el valor supremo de $L(\theta | \mathbf{X})$ y $\operatorname{arg sup} L(\theta | \mathbf{X})$ el el valor de $\theta$ que hace $\operatorname{sup}_{\theta \in \Theta} L(\theta | \mathbf{X})$.

entonces

$$
\begin{split}
\lambda(\mathbf{X})
& = \dfrac{\operatorname{sup}_{\theta \in \Theta_0} L(\theta | \mathbf{X})}{\operatorname{sup}_{\theta \in \Theta} L(\theta | \mathbf{X})} \\
& = \dfrac{(2\pi)^{\frac{n}{2}} \sigma^{-n} \exp{\left[ \frac{-1}{2\sigma^2} \sum_{i=1}^{n} (x_i - \theta_0)^2 \right]}}{(2\pi)^{\frac{n}{2}} \sigma^{-n} \exp{\left[ \frac{-1}{2\sigma^2} \sum_{i=1}^{n} (x_i - \bar{X}_n)^2 \right]}} \\
& = \dfrac{ \exp{\left[ \frac{-1}{2\sigma^2} \sum_{i=1}^{n} (X_i - \theta_0)^2 \right]}}{ \exp{\left[ \frac{-1}{2\sigma^2} \sum_{i=1}^{n} (X_i - \bar{X}_n)^2 \right]}} \\
\end{split}
$$

es decir que $\tau:$ "Rechazar a $H_0$ si $\lambda(\mathbf{X}) = \frac{ \exp{\left[ \frac{-1}{2\sigma^2} \sum_{i=1}^{n} (X_i - \theta_0)^2 \right]}}{ \exp{\left[ \frac{-1}{2\sigma^2} \sum_{i=1}^{n} (X_i - \bar{X}_n)^2 \right]}} \leq c$" con $c \in (0,1)$.

> Este resultado es poco práctico dado que no conocemos la distribución de la variable aleatoria $\dfrac{ \exp{\left[ \frac{-1}{2\sigma^2} \sum_{i=1}^{n} (x_i - \theta_0)^2 \right]}}{ \exp{\left[ \frac{-1}{2\sigma^2} \sum_{i=1}^{n} (x_i - \bar{X}_n)^2 \right]}}$

Ahora teniendo en cuenta que 

$$
\begin{split}
\sum_{i=1}^{n} (x_i - \theta_0)^2 
& = \sum_{i=1}^{n} [x_i - \bar{x} + \bar{x} - \theta_0]^2 \\
& = \sum_{i=1}^{n} (x_i + \bar{x})^2 + n(\bar{x}-\theta_0)^2
\end{split}
$$

entonces

$$
\begin{split}
 \dfrac{ \exp{\left[ \frac{-1}{2\sigma^2} \sum_{i=1}^{n} (X_i - \theta_0)^2 \right]}}{ \exp{\left[ \frac{-1}{2\sigma^2} \sum_{i=1}^{n} (x_i - \bar{X}_n)^2 \right]}} 
 & = \exp{\left[ \frac{-1}{2\sigma^2} \sum_{i=1}^{n} \left[ (X_i - \theta_0)^2 - (X_i - \bar{X}_n)^2 \right]\right]} \\
 & = \exp{\left[ \frac{-1}{2\sigma^2} n(\bar{X}_n - \theta_0)^2 \right]}  \leq c \\
 & = \frac{-1}{2\sigma^2} n(\bar{X}_n - \theta_0)^2  \leq \ln{(c)} \\
 & = n(\bar{X}_n - \theta_0)^2   \geq -2\sigma^2\ln{(c)} \\
 & = (\bar{X}_n - \theta_0)^2   \geq \frac{-2\sigma^2\ln{(c)}}{n} \\
 & = |\bar{X}_n - \theta_0| \geq \sqrt{\frac{-2\sigma^2\ln{(c)}}{n}} \\
\end{split}
$$

y así $\tau$: "Rechazar $H_0$ si $|\bar{X}_n - \theta_0| \geq \sqrt{\frac{-2\sigma^2\ln{(c)}}{n}} = k$"

Vamos a encontrar ahora $k$ de tal manera que  $p[\text{Error tipo I}] = \alpha$

$$
\begin{split}
p\left[ \text{Error tipo I} \right] & = \alpha \\
p\left[ \text{Rechazar} H_0 | H_0 \text{ es cierta} \right] & = \alpha \\
p\left[ |\bar{X}_n - \theta_0|\geq k | \theta = \theta_0 \right] & = \alpha \\
p\left[ |\bar{X}_n - \theta_0|\geq k \right] & = \alpha \\
p\left[ \left| \frac{\bar{X}_n - \theta_0}{\frac{\sigma}{\sqrt{n}}} \right|\geq \frac{k}{\frac{\sigma}{\sqrt{n}}} \right] & = \alpha \\
p\left[ \left| Z \right|\geq \frac{k\sqrt{n}}{\sigma} \right] & = \alpha \\
\end{split}
$$

es decir que en los percentiles $Z \geq \frac{k\sqrt{n}}{\sigma}$ o $Z \leq \frac{k\sqrt{n}}{\sigma}$ es en donde se acumula la probabilidad de cometer un error de tipo I. Graficamente podemos verlo de la manera siguiente.

![](https://cdn.mathpix.com/snip/images/HHDCVQncTgbnojy1I7oJI-7lltbG2W0D44e07q2MJno.original.fullsize.png)

es decir la probabilidad de cometer un error de tipo 1 es de $2p\left[ Z > \frac{-k \sqrt{n}}{\sigma} \right] = \alpha$, donde teniendo encuenta que 

$$
\begin{split}
\frac{-k \sqrt{n}}{\sigma} & = Z_{\frac{\alpha}{2}} \\
k & = \frac{-Z_{\frac{\alpha}{2}} \sigma}{\sqrt{n}} = \frac{Z_{1-\frac{\alpha}{2}} \sigma}{\sqrt{n}} \\
\end{split}
$$

por tanto

$\tau:$ "Rechazar $H_0$ con un nivel de significancia del $100\cdot\alpha\%$ si $H_0$ si $|\bar{X}_n - \theta_0| > k = Z_{1-\frac{\alpha}{2}}\frac{\sigma}{\sqrt{n}}$. Tambien podemos decir que $Z_c=\frac{\bar{X}_n - \theta_0}{\frac{\sigma}{\sqrt{n}}}$ lo que nos deja que "Rechazamos $H_0$ con un nivel de significancia del $100\cdot\alpha\%$ si $|Z_c| > Z_{1-\frac{\alpha}{2}}$"

> Si tenemos el caso donde no conocemos la varianza en una distribución normal y queremos encontrar un test similar al anterior, recordemos que la variable pivote $t_c = \frac{\bar{X}_n - \theta_0}{\frac{S_n}{\sqrt{n}}}$ tiene distribución $t(n-1)$ y de este modo podemos verificar que $\tau:$ "Rechazar $H_0$ si $|\bar{X}_n - \theta_0| > k = t_{1-\frac{\alpha}{2}}(n-1) \frac{S_n}{\sqrt{n}}$ o dicho de otro modo "Rechazar $H_0$ con una significancia de $100\cdot\alpha\%$ si $|t_c| > t_{1-\frac{\alpha}{\sqrt{n}}} (n-1)$

### **Método de inversión del intervalo de confianza**

Sea $\mathbf{X}=\left(\mathrm{X}_{1}, \mathrm{X}_{2}, \ldots, \mathrm{X}_{\mathrm{n}}\right)$ un vector aleatorio parametrizado por $\theta$. Considere el sistema:

$$
\begin{cases}
\mathrm{H}_{0}: \theta=0.5 \\
\text { versus } \\
\mathrm{H}_{1}: \theta \neq 0.5
\end{cases}
$$

> Solo funciona para una prueba de hipótesis a dos colas

![](https://cdn.mathpix.com/cropped/2022_01_28_a289f63458a0886eb568g-09.jpg?height=492&width=580&top_left_y=327&top_left_x=819)

Si se dispone de un I.C. $\operatorname{del} 100(1-\alpha) \%$ para $\theta$, el test $\tau$ :"Rechazar $\mathrm{H}_{0}$ en favor de $\mathrm{H}_{1}$ si $\theta_{0} \notin \mathrm{IC}_{100(1-\alpha) \%}(\theta)$ " es un test de significancia $100 \cdot \alpha \%$. 

### **Tests más potentes**

Ya sabemos como obtener diferentes test y como compararlos, ahora veremos el test acorde de su función de potencia, cual es el mejor o uniformemente más potente.

#### **test insesgado** 

#### Definición: Test insesgado de nivel $\alpha$

Un test, $\tau$, para el sistema:

$$
\begin{cases}
\mathrm{H}_{0}: \theta \in \Theta_{0} \\
\text { versus } \\
\mathrm{H}_{1}: \theta \in \Theta_{0}^c 
\end{cases}
$$

se considera insesgado con nivel $\alpha$ si:

1) $\operatorname{sup}_{\theta \in \Theta_{0}} \pi_{\tau}(\theta) \leq \alpha$ máximo erro tipo I menor a $\alpha$ (nivel $\alpha$)
2) $\operatorname{sup}_{\theta \in \Theta_{0}} \pi_{\tau}(\theta) \leq \operatorname{inf}_{\theta \in \Theta_{0}^c} \pi_{\tau}(\theta)$

![](https://cdn.mathpix.com/snip/images/LgDLMjC-4KOxeJwND_LVk1dcA4DUgFGNBuzPDTG8kY0.original.fullsize.png)

> Lo que se nos está diciendo es que para tener un test insesgado los valores más grandes de $\pi(\theta)$ en $\Theta_0$ son menores o iguales a $\pi(\theta)$ en $\Theta_1$. O dicho de otras palabras el valor más grande entre la hipótesis nula es menor o igual al valor más pequeño dentro de la hipótesis alternativa. 

#### **Test consistente**

#### **Definición de test consistente de nivel $\alpha$**
Un test para el sistema 

$$
\begin{cases}
H_0 : \theta \in \Theta_0 \\
\text{versus} \\
H_1 : \theta \in \Theta_0^c \\
\end{cases}
$$

se considera consistente de nivel $\alpha$ si 

1) $\operatorname{sup}_{\theta \in \Theta_{0}} \pi_{\tau}(\theta) \leq \alpha$ máximo erro tipo I menor a $\alpha$ (nivel $\alpha$)
2) $\lim_{n \to \infty} \pi_{\tau}(\theta) =1 , \forall \theta \in \Theta_0^c$

> Un test consistente es aquel que a medida que se aumenta el tamaño de muestra, el test va aumentado de potencia.

![](https://cdn.mathpix.com/snip/images/XRQbaauA3InEYh073GLzTCk0LTq9l6NBRZPO8oeYopY.original.fullsize.png)

#### Ejemplo 9

Para $X_{1}, X_{2}, \ldots, X_{n}$ una muestra aleatoria ${N}\left(\theta, \sigma^{2}\right), \sigma^{2}$ conocido, considere el LRT de significancia $100 \cdot \alpha \%$ para el sistema:

$$
\left\{\begin{array}{l}
\mathrm{H}_{0}: \theta=\theta_{0} \\
\text { versus } \\
\mathrm{H}_{1}: \theta \neq \theta_{0}
\end{array}\right.
$$

donde $\theta_{0}$ es un valor prefijado por el investigador.

1) ¿Es este test insesgado?

2) ¿Es este test consistente? 

***Solución:***

Tenemos que $X_{1}, X_{2}, \ldots, X_{n}$ m.a $N\left(\theta, \sigma^{2}\right)$ con $\sigma$ conocido. Entonces para

$$
\left\{\begin{array}{l}
\mathrm{H}_{0}: \theta=\theta_{0} \\
\text { versus } \\
\mathrm{H}_{1}: \theta \neq \theta_{0}
\end{array}\right.
$$

vimos que rechazamos $H_{0}$ si $\left|\bar{X}_{n}-\theta_{0}\right|>Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}$. De este modo


(1) Para ver si es un test insesgado tenemos que ver que

1) $\operatorname{sup} _{\theta \in \Theta_0} \pi_{\tau}(\theta) \leq \alpha$

$$
\begin{split}
\operatorname{sup}_{\theta \in \Theta_0} \pi_{\tau}(\theta)
& = \pi_{\tau} (\theta_0) = p\left[\text{Rechazar }H_0 | \theta = \theta_0 \right] \\
& = p\left[\left|\bar{X}_{n}-\theta_{0}\right|>Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} | \theta = \theta_0 \right] \\
& = p\left[\left|\frac{\bar{X}_{n}-\theta_{0}}{\frac{\sigma}{\sqrt{n}}}\right|>Z_{1-\frac{\alpha}{2}} \right] \\
& = p\left[|Z|>Z_{1-\frac{\alpha}{2}} \right] \\
& = \alpha
\end{split}
$$

![](https://cdn.mathpix.com/snip/images/lxAUTMWRLjOj8iw9dMYDLhTaRIg5dJVAzyM3B1V2QXQ.original.fullsize.png)

2) $\operatorname{sup} _{\theta \in \Theta_0} \pi_{\tau}(\theta) \leq \operatorname{inf}_{\theta \in \Theta_0} \pi_{\tau}(\theta)$

Como $\Theta_0 = \{\theta_0\}$ es el único valor en $\Theta_0$ la conclusión es equivalente a probar que $\pi_{\tau}(\theta) \geq \pi_{\tau}(\theta_0) = \alpha$ no basta con probar $\pi_{\tau}(\theta) \geq \alpha$, de este modo tenemos

$$
\begin{split}
\pi_{\tau}(\theta) 
& = p\left[ \left|\bar{X}_{n}-\theta_{0}\right|>Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} | \theta \right] \\
& = p\left[ \bar{X}_{n}-\theta_{0} > Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} \text{ o } \bar{X}_{n}-\theta_{0} < -(Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}) | \theta \right] \\
& = p\left[ \bar{X}_{n}-\theta_{0} > Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} | \theta \right] + p\left[ \bar{X}_{n}-\theta_{0} < -(Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}) | \theta \right] \quad (\text{conjuntos excluyentes})\\
\end{split}
$$
$$
...
$$

(2) Para ver que es un test consistente veamos que 

1) $\operatorname{sup}_{\theta \in \Theta_{0}} \pi_{\tau}(\theta) \leq \alpha$ máximo erro tipo I menor a $\alpha$ (nivel $\alpha$)

2) $\lim_{n \to \infty} \pi_{\tau}(\theta) =1 , \forall \theta \in \Theta_0^c$

Dado que $\Theta_{0} = \{ \theta_0 \}$ nos deja que $\Theta_0^c = \mathbb{R}-\{\theta_0\}$ entonces

$$
\begin{split}
\pi_{\tau}(\theta) 
& = p\left[ \bar{X}_{n}-\theta_{0} > Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} | \theta \right] + p\left[ \bar{X}_{n}-\theta_{0} < -(Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}) | \theta \right] \\
& = p\left[ \bar{X}_{n}-\theta_{0} > Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} \right] + p\left[ \bar{X}_{n}-\theta_{0} < -(Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}) \right] \\
& = p\left[ \bar{X}_{n} > \theta_{0} + Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} \right] + p\left[ \bar{X}_{n} < \theta_{0} -(Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}) \right] \\
& = p\left[ \bar{X}_{n} +\theta > \theta_{0} +\theta + Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} \right] + p\left[ \bar{X}_{n} +\theta < \theta_{0} +\theta -(Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}) \right] \\
& = p\left[ \bar{X}_{n} +\theta > \theta_{0} +\theta + Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} \right] + p\left[ \bar{X}_{n} +\theta < \theta_{0} +\theta -(Z_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}) \right] \\
& = p\left[ \frac{\bar{X}_{n} +\theta}{\frac{\sigma}{\sqrt{n}}} > \frac{\theta_{0} +\theta}{\frac{\sigma}{\sqrt{n}}} + Z_{1-\frac{\alpha}{2}} \right] + p\left[ \frac{\bar{X}_{n} +\theta}{\frac{\sigma}{\sqrt{n}}} < \frac{\theta_{0} +\theta}{ \frac{\sigma}{\sqrt{n}}} -Z_{1-\frac{\alpha}{2}}\right] \\
& = p\left[ Z > \frac{\theta_{0} +\theta}{\frac{\sigma}{\sqrt{n}}} + Z_{1-\frac{\alpha}{2}} \right] + p\left[ Z < \frac{\theta_{0} +\theta}{ \frac{\sigma}{\sqrt{n}}} -Z_{1-\frac{\alpha}{2}} \right] \\
\end{split}
$$

Ahora, asumiendo que $\theta \neq \theta_0$, entonces $\theta \in \Theta_0^c$ entonces

$$
\lim_{n \to \infty} \pi_{\tau}(\theta) = 
\lim_{n \to \infty} p\left[ Z > \frac{\theta_{0} +\theta}{\frac{\sigma}{\sqrt{n}}} + Z_{1-\frac{\alpha}{2}} \right] +
\lim_{n \to \infty} p\left[ Z < \frac{\theta_{0} +\theta}{ \frac{\sigma}{\sqrt{n}}} -Z_{1-\frac{\alpha}{2}} \right]
$$

donde teniendo en cuenta que $\lim_{n\to\infty} p(E_n) = p(\lim_{n\to\infty} E_n)$ siempre y cuando la sucesión de evento $\{E_n\}$ sea creciente o decreciente. Es decir si $E_1 \subseteq E_2 \subseteq \ldots$ entonces $\lim_{n \to \infty} \bigcup_{i=1}^{\infty} E_i$ (creciente) y si $E_1 \supseteq E_2 \supseteq \ldots$ entonces $\lim_{n\to\infty} E_n = \bigcap_{i=1}^{\infty} E_i$ (decreciente). Luengo vemos que

$$
\lim_{n \to \infty} \pi_{\tau}(\theta) = 
p\left[ \lim_{n \to \infty} ( Z > \frac{\theta_{0} +\theta}{\frac{\sigma}{\sqrt{n}}} + Z_{1-\frac{\alpha}{2}}) \right] +
p\left[ \lim_{n \to \infty} ( Z < \frac{\theta_{0} +\theta}{ \frac{\sigma}{\sqrt{n}}} -Z_{1-\frac{\alpha}{2}}) \right]
$$

Haciendo el uso de que si $\theta>\theta_0$ entonces $Z > \frac{\theta_{0} +\theta}{\frac{\sigma}{\sqrt{n}}} + Z_{1-\frac{\alpha}{2}}$ es creciente y $Z < \frac{\theta_{0} +\theta}{ \frac{\sigma}{\sqrt{n}}} -Z_{1-\frac{\alpha}{2}}$ es decreciente. Análogamente lo contrario para $\theta < \theta_0$. Entonces

$$
\lim_{n \to \infty} \pi_{\tau}(\theta) = 
1 +
0 = 1
$$

para $\theta \neq \theta_0$

#### **Test UMP (Uniformemente Más Potente)**

##### Definición Test UMP de nivel $\alpha$
Considere todos los posibles test $\tau$ para el sistema

$$
\begin{cases}
        H_0 : \theta \in \Theta_0 \\
        \text{Vs} \\
        H_1 : \theta \in \Theta_0^c \\
\end{cases}
$$

El test $\tau^*$ se considera el más potente con nivel $\alpha$ si:

1. $\operatorname{sup}_{\theta \in \Theta} \pi_{\tau^*} (\theta) \leq \alpha$ (de nivel $\alpha$)

2. $\pi_{\tau^*}(\theta) \geq \pi_{\tau} (\theta)$ para todo $\theta \in \Theta_0^c $ y para todo test $\tau$ de nivel $\alpha$.

### **Lema de Neyman y Pearson**
Considere $\Theta = \{ \theta_0, \theta_1 \}$ y el sistema

$$
\begin{cases}
H_0 : \theta = \theta_0 \\
\text{Vs} \\
H_1 : \theta = \theta_1
\end{cases}
$$

El test $\tau$: "Rechazar $H_0$ si $L(\theta_1 | \mathbf{x})  > L(\theta_0 | \mathbf{x})$" es un UMP para dicho sistema respecto a los test de nivel menor o igual. 

La constante $k(>0)$ se ajusta a todo lo que se tenga un nivel $\alpha$.