# Testes de Hipótese com Python

In [15]:
# bibliotecas
import math
from scipy.stats import norm, t
import numpy as np

## 1. Teste do INMETRO em pacotes de café
O INMETRO decidiu inspecionar pacotes de café de 500g de um a determinada
marca. Aceita-se como razoável um desvio-padrão de 3g. Após pesar 25 unidades selecionadas em
diversos mercados, chegou-se a uma média amostral de 502g. Pode-se afirmar o peso médio do
produto atende às especificações? Use um nível de confiança de 95%.

In [2]:
# dados fornecidos
media_populacional = 500
media_amostral = 502
desvio_populacional = 3
tam_amostra = 25
alpha = 0.05

In [3]:
# erro padrao
erro_padrao = desvio_populacional / math.sqrt(tam_amostra)
erro_padrao

0.6

In [7]:

# zscore
zscore = (media_amostral - media_populacional) / erro_padrao

# zcritico
zcritico = norm.ppf(1 - alpha / 2) # bicaudal

print(f'zscore: {zscore}')
print(f'zcritico: {zcritico}')

zscore: 3.3333333333333335
zcritico: 1.959963984540054


In [9]:
# resultados
print(f"Erro padrão da média: {erro_padrao:.2f}")
print(f"z-score: {zscore:.2f}")
print(f"z crítico (95% de confiança): ±{zcritico:.2f}")

if abs(zscore) > zcritico:
    print("\nRejeitamos a hipótese nula (H0). O peso médio do produto não atende às especificações.")
else:
    print("\nNão rejeitamos a hipótese nula (H0). O peso médio do produto atende às especificações.")

Erro padrão da média: 0.60
z-score: 3.33
z crítico (95% de confiança): ±1.96
Rejeitamos a hipótese nula (H0). O peso médio do produto não atende às especificações.


## 2. Preços de um determinado artigo
Supõe-se que o preço de determinado artigo nos pontos de venda de certa localidade
tem distribuição normal com média igual a 105,00 e desvio padrão igual a 10,00. Suspeita-se
que, devido ao aumento da demanda, o preço do referido artigo tenha aumentado na região. Para
verificar se isto ocorreu, um pesquisador analisou os preços deste artigo em 40 pontos de venda da
localidade, escolhidos aleatoriamente, constatando que nos pontos de venda pesquisados o preço
médio do artigo é R$110,00.
Qual é a conclusão do pesquisador, admitindo-se um nível de significância de 5%?
Utilize o valor da variável teste, o intervalo de confiança e o valor da prova.

In [10]:
# dados fornecidos
media_populacional = 105
media_amostral = 110
desvio_populacional = 10
tam_amostra = 40
alpha = 0.05

In [11]:
# calculando metricas
erro_padrao = desvio_populacional / math.sqrt(tam_amostra)
zscore = (media_amostral - media_populacional) / erro_padrao
zcritico = norm.ppf(1 - alpha) # unilateral direito

intervalo_inferior = media_amostral - zcritico * erro_padrao
intervalo_superior = media_amostral + zcritico * erro_padrao

In [14]:
# resultados
print(f"Erro padrão da média: {erro_padrao:.2f}")
print(f"z-score: {zscore:.2f}")
print(f"z crítico (para 95% de confiança): {zcritico:.2f}")
print(f"Intervalo de Confiança (95%): ({intervalo_inferior:.2f}, {intervalo_superior:.2f})")

if zscore >= zcritico:
    print("\nRejeitamos a hipótese nula (H0). O preço médio do artigo aumentou.")
else:
    print("\nNão rejeitamos a hipótese nula (H0). Não há evidências suficientes para afirmar que o preço aumentou.")

Erro padrão da média: 1.58
z-score: 3.16
z crítico (para 95% de confiança): 1.64
Intervalo de Confiança (95%): (107.40, 112.60)

Rejeitamos a hipótese nula (H0). O preço médio do artigo aumentou.


## 3. Aumento da produtividade de uma empresa
O tempo gasto pelos operários na montagem de determinado equipamento produzido
por uma empresa tem distribuição normal com média igual a 85 minutos. Os operários foram
submetidos a um processo de reciclagem com o objetivo de melhorar a produtividade. Para
verificar se isso ocorreu, o pesquisador observou o tempo gasto na montagem de 5 unidades deste
equipamento, escolhidas ao acaso na linha de produção, obtendo os seguintes valores, em minutos:
81, 84, 82, 78, 77, 83, 79, 79, 76, 85.
Considerando-se um nível de significância de 5%, pode-se afirmar que após a
reciclagem dos operários houve aumento da produtividade?

In [17]:
# dados fornecidos
dados = [81, 84, 82, 78, 77, 83, 79, 79, 76, 85]
media_populacional = 85
tam_amostra = len(dados)
media_amostral = np.mean(dados)
desvio_amostral = np.std(dados, ddof=1)
alpha = 0.05

In [18]:
# calculando metricas
erro_padrao = desvio_amostral / np.sqrt(tam_amostra)

t_score = (media_amostral - media_populacional) / erro_padrao
t_critico = t.ppf(1 - alpha, tam_amostra - 1) # unilateral

intervalo_superior = media_amostral + t_critico * erro_padrao
intervalo_inferior = media_amostral - t_critico * erro_padrao

In [20]:
# resultados
print(f"Média amostral: {media_amostral:.2f}")
print(f"Desvio padrão amostral: {desvio_amostral:.2f}")
print(f"Erro padrão da média: {erro_padrao:.2f}")
print(f"t-score: {t_score:.2f}")
print(f"t crítico (para 95% de confiança): {t_critico:.2f}")
print(f"Intervalo de Confiança (95%): ({intervalo_inferior:.2f}, {intervalo_superior:.2f})")

if t_score < t_critico:
    print("\nRejeitamos a hipótese nula (H0). Houve melhoria na produtividade dos operários.")
else:
    print("\nNão rejeitamos a hipótese nula (H0). Não há evidências suficientes para afirmar que houve aumento da produtividade.")

Média amostral: 80.40
Desvio padrão amostral: 3.06
Erro padrão da média: 0.97
t-score: -4.75
t crítico (para 95% de confiança): 1.83
Intervalo de Confiança (95%): (78.62, 82.18)

Rejeitamos a hipótese nula (H0). Houve melhoria na produtividade dos operários.
