In [1]:
import numpy as np
import pandas as pd
import seaborn as sns
from scipy.stats import norm
from scipy.stats import t as t_student
sns.set()

![Áreas de Aceitação e Rejeição](https://caelum-online-public.s3.amazonaws.com/1229-estatistica-parte3/01/img002.png)

<img src='https://caelum-online-public.s3.amazonaws.com/1229-estatistica-parte3/01/img003.png' width=70%>

# 1
Um fabricante de farinha afirma que a quantidade média de farinha nas embalagens de seu principal produto é de 500 g. Um teste de pesagem em 30 embalagens amostradas ao acaso mostrou um peso médio igual à 485 g. Estudos anteriores afirmam que a distribuição dos pesos segue uma normal e que o desvio padrão populacional é igual a 20 g. Considerando um nível de significância igual a 5%, responda as seguintes questões:

1) Qual a hipótese nula a ser testada?
>* $H_0: \mu = 500$
2) Qual o valor da estatística de teste?
> -4.107919181288746
3) Qual a conclusão do teste?
> Rejeita H0

### Passo 1 - formulação das hipóteses $H_0$ e $H_1$

* Lembre-se, a hipótese nula sempre contém a alegação de igualdade
>* $H_0: \mu = 500$
>* $H_1: \mu \neq 500$

### Passo 2 - escolha da distribuição amostral adequada
O tamanho da amostra é maior que 30?
> Sim, n=30

O desvio padrão populacional é conhecido?
> Não, temos apenas o desvio da amostra

Distribuição escolhida
>$\bar{x} \pm z \frac{s}{\sqrt{n}}$

### Passo 3 - fixação da significância do teste ($\alpha$)

In [2]:
significancia=0.05
confianca=1-significancia
probabilidade=confianca+significancia/2
z_alpha_2=norm.ppf(probabilidade)
z_alpha_2

1.959963984540054

### Passo 4 - cálculo da estatística-teste

In [65]:
x_bar=485
mu0=500
s=20
n=30
z=(x_bar-mu0)/(s/np.sqrt(n))
z

-4.107919181288746

In [66]:
# rejeitar se z<=z_alpha ou z>=z_alpha
if z<=z_alpha_2 or z>=z_alpha_2:
    print('H0: rejeitado')
else:
    print('H0: confirmado')


H0: rejeitado


# 2
Considere novamente os dados do exercício anterior. Um fabricante de farinha afirma que a quantidade média de farinha nas embalagens de seu principal produto é de 500 g. Um teste de pesagem em 30 embalagens amostradas ao acaso mostrou um peso médio igual à 485 g. Estudos anteriores afirmam que a distribuição dos pesos segue uma normal e que o desvio padrão populacional é igual a 20 g. Com um nível de significância igual a 5%, teste a hipótese nula de que a média do processo é igual a 500 g e marque a alternativa que indica o p-valor do teste aplicado (considere somente 5 casas decimais).

In [67]:
# survival function
p=norm.sf(abs(z))*2
print(round(p,5))
norm.cdf(z)*2


4e-05


3.992397476901338e-05

# 3
A empresa Limpa Esgoto garante ser capaz de realizar o tratamento de esgoto e obter, no máximo, 150 g de impurezas para cada mil litros de esgoto tratado. Vinte amostras de mil litros de esgoto apresentaram, em média, 230 g de impurezas e desvio padrão amostral igual a 90 g.

Assumindo alfa igual a 5% e população normalmente distribuída, seria possível discordar da empresa Limpa Esgoto? Assinale a alternativa que apresenta a estatística de teste e a decisão correta do teste.

### Passo 1 - formulação das hipóteses $H_0$ e $H_1$

* Lembre-se, a hipótese nula sempre contém a alegação de igualdade
> $H_0: \mu \leq 150$  
> $H_1: \mu > 150$

### Passo 2 - escolha da distribuição amostral adequada
O tamanho da amostra é maior que 30?
> Não, n=20

O desvio padrão populacional é conhecido?
> Não, temos apenas o desvio da amostra

Distribuição escolhida
>$\bar{x} \pm t \frac{s}{\sqrt{n}}$

In [6]:
n=20
s=90
significancia=0.05
confianca=1-significancia
media_amostra=230
mu0=150

### Passo 3 - fixação da significância do teste ($\alpha$)

In [7]:
graus_de_liberdade=n-1
significancia=0.05
confianca=1-significancia
probabilidade=confianca
t_alpha=t_student.ppf(probabilidade,graus_de_liberdade)
t_alpha

1.729132811521367

### Passo 4 - cálculo da estatística-teste

In [8]:
x_bar=media_amostra
mu0=mu0
s=s
n=n
t=(x_bar-mu0)/(s/np.sqrt(n))
round(t,4)

3.9752

In [9]:

# rejeitar se t>=t_alpha
if t>=t_alpha:
    print('H0: rejeitado')
else:
    print('H0: confirmado')

H0: rejeitado


# 4
A pizzaria Muito Queijo alega que a quantidade de queijo em suas pizzas tamanho família é de, no mínimo, 350 g. Uma amostra de 35 pizzas tamanho família revelou uma média de 330 g de queijo por pizza. O desvio padrão amostral foi de 80 g.

Assumindo alfa igual a 5% e população normalmente distribuída, seria possível discordar da alegação da pizzaria? Assinale a alternativa que apresenta a estatística de teste e a decisão correta do teste.

### Passo 1 - formulação das hipóteses $H_0$ e $H_1$

* Lembre-se, a hipótese nula sempre contém a alegação de igualdade
> $H_0: \mu \geq 350$  
> $H_1: \mu < 350$

### Passo 2 - escolha da distribuição amostral adequada
O tamanho da amostra é maior que 30?
> Sim, n=35

O desvio padrão populacional é conhecido?
> Não, temos apenas o desvio da amostra

Distribuição escolhida
>$\bar{x} \pm z \frac{s}{\sqrt{n}}$

### Passo 3 - fixação da significância do teste ($\alpha$)

In [52]:
mu0=350
n=35
x_bar=330
s=80
significancia=0.05
confianca=1-significancia
probabilidade=confianca
z_alpha=norm.ppf(significancia)
z_alpha

-1.6448536269514729

### Passo 4 - cálculo da estatística-teste

In [53]:

z=(x_bar-mu0)/(s/np.sqrt(n))
round(z,4)

-1.479

In [55]:
# rejeitar se z<=z_alpha

if z<=z_alpha:
    print('H0: rejeitado')
else:
    print('H0: confirmado')

H0: confirmado


# 6
Um fabricante de cosméticos afirma que a adição de um novo composto químico em sua linha de shampoos consegue promover em mais de 2 centímetros o crescimento dos fios de cabelo em um período de 60 dias. Duas amostras de pessoas foram selecionadas e testadas, uma utilizando o shampoo novo (com o composto) e a outra com o shampoo antigo (sem o composto).

Os resultados (crescimento dos fios de cabelo em centímetros) podem ser verificados na tabela abaixo:

![image.png](attachment:63d7213b-0759-4330-a5cc-65d404cadfd9.png)

Assumindo um nível de confiança de 95% e considerando que as populações se distribuem como uma normal, podemos acreditar na afirmação do fabricante do shampoo? Assinale a alternativa que apresenta a estatística de teste e a decisão correta do teste.

Um pouco mais de teoria: como se trata de um problema um pouco diferente do apresentado em nossa aula, vamos esclarecer alguns pontos para ajudar na solução:

1) Em testes entre duas amostras, quando realizamos a escolha da distribuição amostral adequada (passo 2) e perguntamos se n ≥ 30, temos que considerar que n = n1 + n2, onde n1 é o tamanho da primeira amostra e n2 o tamanho da segunda;

2) Quando n1 + n2 ≥ 30, utilizamos z (normal), e quando n1 + n2 < 30, σ não for conhecido e as populações forem normalmente distribuídas, utilizamos t (t-Student);

3) Quando utilizamos a tabela t de Student, em teste de duas amostras, os graus de liberdade são obtidos da seguinte forma: n1 + n2 - 2;

4) Quando o problema nos pergunta se podemos acreditar na afirmação do fabricante, está nos indicando o que devemos testar, ou seja, a nossa hipótese alternativa (H1), que no caso é:

Onde:

μ1 = Crescimento médio dos cabelos com o uso do novo shampoo μ2 = Crescimento médio dos cabelos com o uso do shampoo antigo.

### Passo 1 - formulação das hipóteses $H_0$ e $H_1$

* Lembre-se, a hipótese nula sempre contém a alegação de igualdade
> $H_0: \mu_1-\mu_2 \leq 2$  
> $H_1: \mu_1-\mu_2 > 2$

### Passo 2 - escolha da distribuição amostral adequada
O tamanho da amostra é maior que 30?
> Não, n=20

O desvio padrão populacional é conhecido?
> Não, temos apenas o desvio da amostra

Distribuição escolhida
>$\bar{x} \pm t \frac{s}{\sqrt{n}}$

In [48]:
s_n=[3.4,4.9,2.8,5.5,3.7,2.5,4.3,4.6,3.7,3.4]
s_a=[0.3,1.2,1.2,1.7,1.1,0.6,1.2,1.5,0.5,0.7]
sn=pd.DataFrame(s_n,columns=['Shampoo Novo'])
sa=pd.DataFrame(s_a,columns=['Shampoo Antigo'])
n=len(sa)+len(sn)
n1=len(sn)
n2=len(sa)
graus_de_liberdade=n-2
confianca=0.95
significancia=1-confianca
x_bar1=sn['Shampoo Novo'].mean()
x_bar2=sa['Shampoo Antigo'].mean()
sigma1=sn['Shampoo Novo'].std()
sigma2=sa['Shampoo Antigo'].std()
D0=2
sigma2

0.4546060565661952

### Passo 3 - fixação da significância do teste ($\alpha$)

In [49]:
probabilidade=confianca
t_alpha=t_student.ppf(probabilidade,graus_de_liberdade)
t_alpha

1.7340636066175354

### Passo 4 - cálculo da estatística-teste

In [50]:
t=((x_bar1-x_bar2)-D0)/np.sqrt(((sigma1**2)/n1)+((sigma2**2)/n2))
round(t,4)


2.6646

In [51]:
# rejeitar se z>=z_alpha
t>=t_alpha
#Rejeita

True