# 6. Teste de Hipóteses

Feita determinada afirmação sobre uma população, usualmente sobre um parâmetro dessa, desejamos saber se os resultados experimentais provenientes de uma amostra contrariam ou não tal afirmação. Muitas vezes, essa afirmação sobre a população é derivada de teorias desenvolvidas no campo substantivo do conhecimento. A adequação ou não dessa teoria ao universo real pode ser verificada ou refutada pela amostra.

O objetivo do teste estatístico de hipóteses é, então, fornecer uma metodologia que nos permita verificar se os dados amostrais trazem evidências que apóiem ou não uma hipótese (estatística) formulada.

**Exemplo**

Uma indústria usa um tipo de parafuso importado, que deve satisfazer a uma exigência com relação a resistência à tração. Esses parafusos são fabricados por alguns países, e as especificações técnicas variam de país para país. Por exemplo, os catálogos dos países A e B afirmam o seguinte sobre resistência à tração de seus parafusos:

$$\mu_A=145 kg \text{ e } \sigma_A = 12 kg$$
$$\mu_B=155 kg \text{ e } \sigma_B = 20 kg$$

Um lote desses parafusos, de origem desconhecida, será leiloado a um preço muito convidativo. Para que a indústria saiba se faz ou não uma oferta, ela necessita saber qual país produziu tais parafusos. O edital do leiloeiro afirma que, pouco antes do leilão, será divulgada a resistência média $\overline{X}$ de uma amostra de 25 parafusos do lote. Qual regra de decisão deve ser usada pela indústria para dizer se os parafusos são do país A ou B?

Uma regra de decisão poderia ser:

<img src='regra_de_decisao.png' width=500>

REGRA DE DECISÃO: Se $\overline{X} \leq 150$ (valor médio entre $\mu_a$ e $\mu_B$), diremos que os parafusos são do país A, caso contrário, do país B. 

Então, podemos ter duas **Hipóteses:**

$H_0$: os parafusos são de origem B. (Hipótese nula)

$H_1$: os parafusos são de origem A. (Hipótese alternativa)

No dia do leilão, o leiloeiro informa:

$$\overline{X}=148$$

De acordo com a nossa regra de decisão, diríamos que o lote de parafusos é do país A e que a hipótese nula não é verdadeira.

Podemos estar enganados nessa conclusão? Ou seja, de acordo com o que vimos até hoje, existe a possibilidade da média amostral dos parafusos do país B ser diferente da média populacional a ponto de $\overline{X}_B \leq 150$?

Resposta: SIM!

## 6.1 Tipos de erro

**Erro do tipo I:** dizer que os parafusos são de A quando na realidade são de B. De acordo com a nossa regra de decisão, quando isso ocorre?
$$\{\text{rejeitamos } H_0|H_0 \text{ é verdadeira}\}$$
**Erro do tipo II:** dizer que os parafusos são de B, quando na realidade eles são de A. De acordo com a nossa regra de decisão, quando isso ocorre?
$$\{\text{não rejeitamos } H_0|H_0 \text{ é falsa}\}$$

Vamos indicar por Região Crítica (RC) a região correspondente aos valores menores que 150:

$$RC = \{y \in R | y \leq 150\}$$

$$\overline{x}_c = 150$$

Ou seja, se a nossa média amostral cair nessa região, rejeitaremos a hipótese nula.

Assim, pode definir as probabilidade de se cometer cada um dos erros como:

$$P(\text{erro I}) = P(\overline{X} \in RC|H_0 \text{ é verdadeira}) = \alpha$$
$$P(\text{erro II}) = P(\overline{X} \notin RC|H_1 \text{ é verdadeira}) = \beta$$

Para encontramos essas probablidades, podemos fazer:

* Quando $H_0$ for verdadeira (os parafusos forem de B):

Lembrando que

$$\mu_B=155 kg \text{ e } \sigma_B = 20 kg$$

e do **TLC**, que diz que

$$\overline{X} \sim N\left(\mu,\left(\sigma/\sqrt{n}\right)^2\right).$$


Logo,

$$\overline{X} \sim N(155,16)$$

Denotando por Z a variável aleatória com distribuição $N(0,1)$, temos:

$$P(\text{erro I}) = P(\overline{X} \in RC | H_0 \text{ é verdadeira})$$

$$= P(\overline{X} \leq 150 | \overline{X} \sim N(155,16))$$

Lembrando da transformação: $ z = \frac{x - \mu}{\sigma} $

$$= P\left(Z \leq \frac{150 - 155}{4}\right)$$

$$= P(Z \leq -1,25) = 0,10565 = 10,56\% = \alpha$$


Utilizando o Python para calcular $\alpha$:

In [2]:
from scipy.stats import norm

x_barra_c = 150
media = 155
desvio_padrao = 4

z_critico = (x_barra_c - media) / desvio_padrao

p_erro_I = norm.cdf(z_critico)

print('z_critico: ',z_critico)
print('Probabilidade de erro do tipo I:',p_erro_I)

z_critico:  -1.25
Probabilidade de erro do tipo I: 0.10564977366685535


* Quando H_1 for a alternativa verdadeira, teremos que a v.a. $\overline{X}$ é

$$\overline{X} \sim N(145; 5,76)$$

O erro do tipo II terá probabilidade de acontecer igual a:

$$P(\text{erro II}) = P(\overline{X} \notin RC | H_1 \text{ é verdadeira})$$

$$= P(\overline{X} > 150 | \overline{X} \sim N(145;5,76))$$

$$= P\left(Z > \frac{150 - 145}{2,4}\right)$$

$$= P(Z > 2,08) = 0,01861 = 1,86\% = \beta$$


Exercício:

Calcule o valor do $z_{critico}$ e de $\beta$ utilizando o Python.

In [5]:
x_barra_c = 150
media = 145
desvio_padrao = 2.4

z_critico = (x_barra_c - media)/desvio_padrao

p_erro_II = 1 - norm.cdf(z_critico)

print(f'z_critico:{z_critico}')
print(f'Porbabilidade do erro do tipo II: {p_erro_II:.5f}')

z_critico:2.0833333333333335
Porbabilidade do erro do tipo II: 0.01861


Resumindo:

<img src='resumo_teste_hipotese_nula.png' width=500>

Obs: O beta na figura está igual a 1,88% por que o livro arredondou o valor do $z_{critico}$ para 2,08.

--------

Agora, é importante lembrarmos que escolhemos no início da aula que o valor de $\overline{x}_c$ seria o valor médio entre $\mu_A$ e $\mu_B$, mas essa não é uma escolha obrigatória. Podemos escolher um $\overline{x}_c \neq 150$.

Assim, para cada regra de decisão adotada, isto é, se escolhermos um valor de $\overline{x}_c \neq 150$, as probablidades $\alpha$ e $\beta$ mudarão.

Usualmente, procedemos de modo inverso: fixamos um dos erros (geralmente $\alpha$) e encontramos a regra de decisão que irá corresponder a este valor.

Por exemplo, se definirmos $\alpha = 5\%$, a regra de decisão será:

$$P(\text{erro I}) = P(\overline{X} \leq \overline{x}_c | \overline{X} \sim N(155,16)) = 0,05$$

$$P(Z \leq z_c) = 0,05$$

Da tabela do Z-score para a probabilidade acumulada de 0,05, temos $z_c = -1,645$. Da transformação para a normal padrão sabemos que

$$\frac{\overline{x}_c - 155}{4}=-1,645.$$

Logo,

$$\overline{x}_c = 148,42.$$

Por fim, a **regra de decisão** será:

Se $\overline{x}$ for inferior a 148,42, dizemos que o lote é de A; caso contrário, dizemos que é de B.

<img src='distribuicao_A_e_B.png' width=500>

----

## 6.2 Procedimento Geral do Teste de Hipóteses

* Passo 1. Fixe qual a hipótese $H_0$ a ser testada e qual a hipótese alternativa $H_1$.
* Passo 2. Use a teoria estatística e as informações disponíveis para decidir qual estatística (estimador) será usada para testar a hipótese $H_0$. Obter as propriedades dessa estatística (distribuição, média, desvio padrão).
* Passo 3. Fixe a probabilidade $\alpha$ de cometer o erro de tipo I e use este valor para construir a região crítica (regra de decisão). Lembre que essa região é construída para a estatística definida no passo 2, usando os valores do parâmetro hipotetizados por $H_0$.
* Passo 4. Use as observações da amostra para calcular o valor da estatística do teste.
* Passo 5. Se o valor da estatística calculado com os dados da amostra não pertencer à região crítica, não rejeite H0; caso contrário, rejeite H0.

**Exercício:**

Uma máquina automática para encher pacotes de café enche-os segundo uma distribuição normal, com média μ e variância sempre igual a 400 $g^2$. A máquina foi regulada para μ = 500 g. Desejamos, periodicamente, colher uma amostra de 16 pacotes e verificar se a produção está sob controle, isto é, se μ = 500 g ou não. Se uma dessas amostras apresentasse uma média $\overline{X} = 492$ g, você pararia ou não a produção para regular a máquina?

* **Passo 1**

X o peso de cada pacote, então $X \sim N(500, 400)$ e 

$$H_0: \mu = 500$$
$$H_1: \mu \neq 500$$

* **Passo 2**

DO TLC, se $H_0$ for verdadeira,

$$\overline{X} \sim N(500,25)$$

* **Passo 3**

Vamos fixar α = 1\%; pela hipótese alternativa, vemos que $H_0$ deve ser rejeitada quando $\overline{X}$ for muito pequena ou muito grande (dizemos que temos um teste bilateral).

Logo, a região crítica, será:
<img src='regiao_critica_bilateral.png' width=500>

In [7]:
media = 500
desvio_padrao = 5
z_critico_1 = norm.ppf(q=0.005)
z_critico_2 = norm.ppf(q=0.995)

x_critico_1 = z_critico_1*desvio_padrao + media
x_critico_2 = z_critico_2*desvio_padrao + media

print(f'A região crítica é: x_barra <= {x_critico_1:.1f} ou x_barra >= {x_critico_2:.1f}')

A região crítica é: x_barra <= 487.1 ou x_barra >= 512.9


* **Passo 4**

A informação pertinente da amostra é sua média, que nesse caso particular é $\overline{x}_0 = 492.$

* **Passo 5**

Como $\overline{x}_{c1} \leq \overline{x}_0 \leq \overline{x}_{c2}$, nossa conclusão será não rejeitar $H_0$. Ou seja, o desvio da média da amostra para a média proposta por $H_0$ pode ser considerada como devido apenas ao sorteio aleatório dos pacotes. 

Referência:

* Morettin, P. A., & Bussab, W. O. (2017). Estatística básica. Saraiva Educação SA. (Capítulo 12)

Dica do Augusto: Nessa playlist tem outros exemplos de outros tipos de teste de hipotese. 
https://www.youtube.com/watch?v=h4QcWDDlrW0&list=PL7xT0Gz6G0-TfV-S6WiGDvIsZds6Pv_g8