<a href="https://colab.research.google.com/github/angelafrocha/estatistica/blob/main/Teste_Bicadal.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

A empresa **Suco Bom** produz **sucos de frutas em embalagens de 500 ml**. Seu processo de produção é quase todo automatizado e as embalagens de sucos são preenchidas por uma máquina que às vezes apresenta um certo desajuste, levando a erros no preenchimento das embalagens para mais ou menos conteúdo. Quando o volume médio cai abaixo de 500 ml, a empresa se preocupa em perder vendas e ter problemas com os orgãos fiscalizadores. Quando o volume passa de 500 ml, a empresa começa a se preocupar com prejuízos no processo de produção.

O setor de controle de qualidade da empresa **Suco Bom** extrai, periodicamente, **amostras de 50 embalagens** para monitorar o processo de produção. Para cada amostra, é realizado um **teste de hipóteses** para avaliar se o maquinário se desajustou. A equipe de controle de qualidade assume um **nível de significância de 5%**.

Suponha agora que uma **amostra de 50 embalagens** foi selecionada e que a **média amostral observada foi de 503,24 ml**. **Esse valor de média amostral é suficientemente maior que 500 ml para nos fazer rejeitar a hipótese de que a média do processo é de 500 ml ao nível de significância de 5%?**

In [1]:
import numpy as np
from scipy import stats
import pandas as pd

In [2]:
data = [509, 505, 495, 510, 496, 509, 497, 502, 503, 505,
           501, 505, 510, 505, 504, 497, 506, 506, 508, 505,
           497, 504, 500, 498, 506, 496, 508, 497, 503, 501,
           503, 506, 499, 498, 509, 507, 503, 499, 509, 495,
           502, 505, 504, 509, 508, 501, 505, 497, 508, 507]

amostra = pd.DataFrame(data, columns=['Amostra'])
amostra.head()

Unnamed: 0,Amostra
0,509
1,505
2,495
3,510
4,496


In [6]:
# Cálculo da média e desvio padrão
media_amostral = amostra['Amostra'].mean()
desvio_padrao_amostral = amostra['Amostra'].std()
n = len(amostra)

# Realizando o teste t
mu0 = 500
t_stat = (media_amostral - mu0) / (desvio_padrao_amostral/np.sqrt(n))
p_value = 2 * (1 - stats.t.cdf(np.abs(t_stat), df=n-1))


print(f'Tamanho da amostra: {n}')
print(f"Média amostral: {media_amostral:.2f}")
print(f"Desvio padrão amostral: {desvio_padrao_amostral:.2f}")
print(f"Estatística t: {t_stat:.2f}")
print(f"p-value: {p_value:.4f}")

Tamanho da amostra: 50
Média amostral: 503.24
Desvio padrão amostral: 4.48
Estatística t: 5.11
p-value: 0.0000


In [7]:
significancia = 0.05

if p_value < significancia:
    print("Hipótese nula Rejeitada: O maquinário precisa ser ajustado!")
else:
    print("Hipotese nula não Rejeitada: O maquinário está ok!")

Hipótese nula Rejeitada: O maquinário precisa ser ajustado!
