# Testes de hipóteses

**Testes de hipóteses são métodos estatísticos usados para tomar decisões sobre populações baseando-se em dados amostrais. Eles envolvem:**

- Duas hipóteses: nula (H0) e alternativa (H1).
- Uma estatística de teste calculada a partir dos dados da amostra.
- Um nível de significância (α) predefinido.
- O cálculo do valor-p.
- Uma decisão baseada na comparação entre o valor-p e o nível de significância.


Esses testes permitem que pesquisadores e analistas façam inferências sobre populações, quantifiquem a evidência contra a hipótese nula e tomem decisões informadas, considerando a incerteza amostral.

**Com esse contexto, vamos analisar a afirmação abaixo:**

Uma drogaria informa que a média do tempo de entrega de um medicamento é menor que 38 minutos. 

Foi realizada uma amostragem de 36 entregas de medicamentos para verificar o tempo de entrega e foi obtido uma média de 36,5 minutos com desvio padrão de 3,5 minutos, considerando nível de significância de 0,01, há evidência suficiente para apoiar a afirmação da drogaria?

## Passo 1: Formulação das Hipóteses

- **Hipótese nula (H0)**: A média do tempo de entrega é maior ou igual a 38 minutos.
- **Hipótese alternativa (Ha)**: A média do tempo de entrega é menor que 38 minutos.


## Passo 2: Coletar e Organizar os Dados

Aqui estão os dados fornecidos:

In [1]:
media_hipotetica = 38  # Média afirmada pela drogaria
media_amostra = 36.5    # Média da amostra observada
desvio_padrao = 3.5     # Desvio padrão da amostra
tamanho_amostra = 36    # Tamanho da amostra
nivel_significancia = 0.01  # Nível de significância

## Passo 3: Cálculo da Estatística de Teste

Vamos calcular a estatística t:

In [2]:
from scipy import stats
import numpy as np

t_estatistica = (media_amostra - media_hipotetica) / (desvio_padrao / np.sqrt(tamanho_amostra))
t_estatistica

-2.571428571428571

A fórmula subtrai a média hipotética (38) da média amostral (36,5), dividindo o resultado pelo erro padrão da média.

Erro padrão da média: Calculado como o desvio padrão da amostra dividido pela raiz quadrada do tamanho da amostra. Este valor mostra a variabilidade esperada na média amostral se a hipótese nula for verdadeira.

## Passo 4: Cálculo o valor-p

O valor-p mede a probabilidade de obter uma estatística t tão extrema ou mais extrema que a observada, assumindo que a hipótese nula é verdadeira.

In [3]:
valor_p = stats.t.sf(abs(t_estatistica), df=tamanho_amostra-1)
valor_p

0.007267498658960822

`sf` (survival function) retorna a probabilidade de a estatística t ser maior que um determinado valor (o complemento da função de distribuição acumulada). Usada aqui para um teste unilateral.


`abs`(t_estatistica): Usa o valor absoluto de t_estatistica para garantir que estamos medindo a extremidade correta da distribuição t.

## Decisão baseada no valor-p

In [4]:
if valor_p < nivel_significancia:
    decisao = "Rejeitar a hipótese nula"
    conclusao = "Há evidência suficiente para apoiar a afirmação da drogaria."
else:
    decisao = "Não rejeitar a hipótese nula"
    conclusao = "Não há evidência suficiente para apoiar a afirmação da drogaria."

Se o valor-p for menor que o nível de significância (α), rejeitamos a hipótese nula. Isso significa que a evidência da amostra é forte o suficiente para suportar a afirmação de que a média do tempo de entrega é menor que 38 minutos.


Dependendo do valor-p, o código decide se há ou não evidência suficiente para apoiar a afirmação da drogaria.

In [5]:
print(f"Estatística t: {t_estatistica:.4f}")
print(f"Valor-p: {valor_p:.4f}")
print(f"Decisão: {decisao}")
print(f"Conclusão: {conclusao}")

Estatística t: -2.5714
Valor-p: 0.0073
Decisão: Rejeitar a hipótese nula
Conclusão: Há evidência suficiente para apoiar a afirmação da drogaria.


## Conclusão

**Há evidência suficiente para apoiar a afirmação da drogaria de que a média do tempo de entrega é menor que 38 minutos.**