A empresa **Suco Bom** produz **sucos de frutas em embalagens de 500 ml**. Seu processo de produção é quase todo automatizado e as embalagens de sucos são preenchidas por uma máquina que às vezes apresenta um certo desajuste, levando a erros no preenchimento das embalagens para mais ou menos conteúdo. Quando o volume médio cai abaixo de 500 ml, a empresa se preocupa em perder vendas e ter problemas com os orgãos fiscalizadores. Quando o volume passa de 500 ml, a empresa começa a se preocupar com prejuízos no processo de produção.

O setor de controle de qualidade da empresa **Suco Bom** extrai, periodicamente, **amostras de 50 embalagens** para monitorar o processo de produção. Para cada amostra, é realizado um **teste de hipóteses** para avaliar se o maquinário se desajustou. A equipe de controle de qualidade assume um **nível de significância de 5%**.

Suponha agora que uma **amostra de 50 embalagens** foi selecionada e que a **média amostral observada foi de 503,24 ml**. **Esse valor de média amostral é suficientemente maior que 500 ml para nos fazer rejeitar a hipótese de que a média do processo é de 500 ml ao nível de significância de 5%?**

![Teste Bicaudal](https://caelum-online-public.s3.amazonaws.com/1229-estatistica-parte3/01/img005.png)

O **teste bicaudal** é muito utilizado em **testes de qualidade**, como o apresentado em nosso problema acima. Outro exemplo é a avaliação de peças que devem ter um encaixe perfeito (porcas e parafusos, chaves e fechaduras).

In [1]:
import pandas as pd

In [2]:
amostra = [ 509, 505, 495, 510, 496, 509, 497, 502, 503, 505,
            510, 496, 509, 497, 502, 503, 505, 501, 497, 503,
            502, 503, 505, 501, 497, 503,504, 506, 508, 509,
            495, 510, 496, 509, 497, 501, 497, 500, 503, 505,
            510, 496, 509, 497, 498, 509, 506, 498, 497, 503 ]


In [3]:
amostra = pd.DataFrame(amostra, columns=['Amostra'])
amostra.head()

Unnamed: 0,Amostra
0,509
1,505
2,495
3,510
4,496


In [4]:
mean_amostra = amostra.mean()[0]
desvio_padrao_amostra = amostra.std()[0]


In [5]:
media = 500
significancia = 0.05
confianca = 1 - significancia
n = 50

### Passo 1 - Formulação de $H_0$: e $H_1$

$H_0: \mu $ = 500

$H_1: \mu  \neq $ 500

### Passo 2 - Escolher a distribuição amostral adequada


$ n \geq 30 $ ?
    
    R: Sim

Desvio padrão conhecido($\sigma$)?

    R: Não, por isso foi calculado o da amostra.

### Passo 3 - Fixação de significância do teste ($\alpha$)
.... Área de fixação e rejeição

In [6]:
probabilidade = (0.5 + (confianca / 2))

In [7]:
from scipy.stats import norm

Obtendo $\frac{z _\alpha }{2} $

In [8]:
z_alpha_2 = norm.ppf(probabilidade)

![Região de Aceitação](https://caelum-online-public.s3.amazonaws.com/1229-estatistica-parte3/01/img006.png)

### Passo 4 - Cálculo da estatística-teste e verificação

# $$z = \frac{\bar{x} - \mu_0}{\frac{s}{\sqrt{n}}}$$

In [9]:
import numpy as np

In [10]:
z = (mean_amostra - media) / (desvio_padrao_amostra / np.sqrt(n))

### Passo 5 - aceitação ou rejeição

<img src='https://caelum-online-public.s3.amazonaws.com/1229-estatistica-parte3/01/img013.png' width=90%>

Como trata-se de um teste bicaldau, rejeita-se a amostra pois z foi maior que o valor obtido de $\frac{z_a}{2}$