# **TTI109 - Estatística**
# **Laboratório 10 - Introdução ao Teste de Hipótese**

Nessa aula vamos aprender a:

* Formular hipóteses
* Aplicar o teste Z para médias com desvio padrão conhecido
* Calcular e interpretar o valor crítico e o valor p
* Tomada de decisão: Rejeitar ou não a hipótese nula com base nos resultados

### **Exercício 1 (guiado):** Teste de Hipótese Bilateral

Considere um fabricante que anuncia que seu novo carro híbrido tem média de consumo de combustível de 50 milhas por galão. Se você suspeitar que o consumo médio não é de 50 milhas por galão, como você poderia mostrar que o anúncio é falso?

Para este exercício, suponha uma amostra de 30 carros que possua o seguinte resultado:
* Considere o nível de significância ($\alpha$) de 0,05 que corresponde a um nível de confiança de 95%
* Média amostral ($\overline{x}$): 47 milhas por galão
* Desvio padrão populacional ($\sigma$): 5,5 milhas por galão
* Tamanho da amostra (n): 30

### **Sugestão de passos para os cálculos:** 

**1. Definir as hipóteses**

* Hipótese nula ($H_0$): O consumo médio do carro híbrido é 50 milhas por galão.
$$H_0: \mu = 50$$

* Hipótese alternativa ($H_a$): O consumo médio do carro híbrido é diferente de 50 milhas por galão.
$$H_a: \mu \neq 50$$

**2. Calcular a estatística de teste z:**

Como temos o desvio padrão populacional conhecido, vamos usar o teste z.

A estatística de teste é dada pela fórmula:
$$z = \frac{\overline{x}-\mu}{\frac{\sigma}{\sqrt{n}}}$$

Onde:
* $\overline{x}$ = 47 é a média da amostra
* $\mu$ = 50 é a média populacional (50 milhas por galão)
* $\sigma$ = 5,5 é o desvio padrão da amostra
* n = 30 é o tamanho da amostra

O resultado da estatística Z nos diz quantos erros padrões a média amostral está distante da média populacional anunciada. Neste caso, -2,99.

**3. Substitua os valore e determine o valor crítico:**

* Como estamos realizando um teste bilateral, dividimos o nível de significância em duas caudas, ou seja, ($\alpha$) por 2: $\alpha$ / 2 = 0,025
* Para um nível de significância de 0,05, o valor $z_c$ da tabela z: 1,96

O valor crítico $z_c$ é o ponto de corte que separa as regiões de aceitação e rejeição da hipótese nula.

*Exemplo de código *Python* para obter o valor de $z_c$ é:*

```Python
z_critico = stats.norm.ppf(1 - nivel_significancia / 2)
```

Onde:
* `stats.norm.ppf(1 - nivel_significancia / 2)`: Calcula o valor Z que corresponde ao ponto de 0,025 (para cada cauda) da distribuição normal padrão.
* O valor crítico para um nível de significância de 5% é aproximadamente ± 1,96.

**4. Comparar a estatística de teste z com o valor crítico:**


* Se o valor absoluto da estatística de teste ∣z∣ for maior que o valor crítico, rejeitamos a hipótese nula.
* Como ∣z∣ = 2,99 é maior que 1,96, rejeitamos a hipótese nula.

O valor p é a probabilidade de obter um valor tão extremo quanto o que observamos (Z=−2,99) sob a hipótese nula. Um valor p pequeno indica que a hipótese nula é improvável.

*Exemplo de código *Python* para obter o valor de p é:*

```Python
p_valor = 2 * (1 - stats.norm.cdf(abs(z)))
```

Onde:
* `stats.norm.cdf`: Calcula a área acumulada até o valor z, ou seja, a probabilidade de observar um valor menor ou igual a z.
* Multiplicamos o valor p por 2 porque estamos realizando um teste bilateral, que considera desvios em ambas as direções (tanto para mais quanto para menos).

### Agora é a sua vez, construa o código Python que resolve este exercício!

In [1]:
# Importa as bibliotecas
import numpy as np
import scipy.stats as stats

# Dados do problema
m = 50
x = 47
s = 0.05
dp = 5.5
n = 30
z = (x - m)/(dp/n**0.5)
# Média da amostra
print('Média da amostra:', x)
print('')
# Média anunciada pelo fabricante
print('Média anunciada pelo fabricante:', m)
print('')
# Desvio padrão populacional
print('Desvio padrão populacional:', dp)
print('')
# Tamanho da amostra
print('Tamanho da amostra:', n)
print('')
# Nível de significância
print('Nível de significância:', s)
print('')
# Estatística de teste Z
print(f'Estatística de teste Z: {z:.2f}')
print('')

# Valor crítico para teste bilateral
zc = stats.norm.ppf(1 - s/2)


# Valor p
p = 2*(1 - stats.norm.cdf(abs(z)))


# Resultados
print(f'Valor crítico para teste bilateral: {zc:.2f}')
print('')
print(f'Valor p: {p:.4f}')
print('')
print('Rejeita-se a hipótese nula') if abs(z) > zc else print('Aceita-se a hipótese nula')



Média da amostra: 47

Média anunciada pelo fabricante: 50

Desvio padrão populacional: 5.5

Tamanho da amostra: 30

Nível de significância: 0.05

Estatística de teste Z: -2.99

Valor crítico para teste bilateral: 1.96

Valor p: 0.0028

Rejeita-se a hipótese nula


In [2]:
# extra:

m = 500
x = 495
n = 40
dp = 10
s = 0.05
z = (x - m)/(dp/n**0.5)
print(f"z = {z:.2f}")
print('')
zc = stats.norm.ppf(1 - s/2)
p = 2*(1 - stats.norm.cdf(abs(z)))
print(f'Valor crítico para teste bilateral: {zc:.2f}')
print('')
print(f'Valor p: {p:.4f}')
print('')
print('Rejeita-se a hipótese nula') if abs(z) > zc else print('Aceita-se a hipótese nula')


z = -3.16

Valor crítico para teste bilateral: 1.96

Valor p: 0.0016

Rejeita-se a hipótese nula
