### Um fabricante de farinha afirma que a quantidade média de farinha nas embalagens de seu principal produto é de 500 g. Um teste de pesagem em 30 embalagens amostradas ao acaso mostrou um peso médio igual à 485 g. Estudos anteriores afirmam que a distribuição dos pesos segue uma normal e que o desvio padrão populacional é igual a 20 g. Considerando um nível de significância igual a 5%, responda as seguintes questões:

> **$H_0 : \mu = 500$** <br>
> **$H_1 : \mu \neq 500$**

In [2]:
import numpy as np
from scipy.stats import norm

In [3]:
media = 500
n = 30
media_amostra = 485

In [4]:
sigma = 20
probabilidade = 0.95 / 2 + 0.5

In [5]:
z_alpha_2 = norm.ppf(probabilidade)
z_alpha_2

1.959963984540054

In [6]:
z = (media_amostra - media) / (sigma / np.sqrt(n))
z

-4.107919181288746

In [7]:
z <= z_alpha_2

True

In [8]:
z >= z_alpha_2

False

In [9]:
print(f'Como z<=z_alpha_2 nega-se a hipótese nula')

Como z<=z_alpha_2 nega-se a hipótese nula


### Considere novamente os dados do exercício anterior. Um fabricante de farinha afirma que a quantidade média de farinha nas embalagens de seu principal produto é de 500 g. Um teste de pesagem em 30 embalagens amostradas ao acaso mostrou um peso médio igual à 485 g. Estudos anteriores afirmam que a distribuição dos pesos segue uma normal e que o desvio padrão populacional é igual a 20 g. Com um nível de significância igual a 5%, teste a hipótese nula de que a média do processo é igual a 500 g e marque a alternativa que indica o p-valor do teste aplicado (considere somente 5 casas decimais).

> **$H_0 : \mu = 500$** <br>
> **$H_1 : \mu \neq 500$**

In [10]:
media = 500
n = 30
media_amostra = 485
sigma = 20
significancia = 0.05

In [11]:
z = (media_amostra - media) / (sigma /np.sqrt(n))
z

-4.107919181288746

In [12]:
p_valor = 2 * norm.sf(z)

In [13]:
p_valor

1.999960076025231

### A empresa Limpa Esgoto garante ser capaz de realizar o tratamento de esgoto e obter, no máximo, 150 g de impurezas para cada mil litros de esgoto tratado. Vinte amostras de mil litros de esgoto apresentaram, em média, 230 g de impurezas e desvio padrão amostral igual a 90 g.
### Assumindo alfa igual a 5% e população normalmente distribuída, seria possível discordar da empresa Limpa Esgoto? Assinale a alternativa que apresenta a estatística de teste e a decisão correta do teste.

In [14]:
media = 150
n = 20
media_amostra = 230
desvio_padrao_amostra = 90
significancia = 0.05
confianca = 1 - significancia

In [15]:
from scipy.stats import t as t_student

In [16]:
t_alpha = t_student.ppf(confianca, n-1)
t_alpha

1.729132811521367

In [17]:
t = (media_amostra - media) / (desvio_padrao_amostra / np.sqrt(n))
t

3.9752319599996264

In [18]:
t <= t_alpha

False

### A pizzaria Muito Queijo alega que a quantidade de queijo em suas pizzas tamanho família é de, no mínimo, 350 g. Uma amostra de 35 pizzas tamanho família revelou uma média de 330 g de queijo por pizza. O desvio padrão amostral foi de 80 g.

### Assumindo alfa igual a 5% e população normalmente distribuída, seria possível discordar da alegação da pizzaria? Assinale a alternativa que apresenta a estatística de teste e a decisão correta do teste.

In [19]:
media = 350
n = 35
media_amostra = 330
desvio_padrao_amostra = 80
significancia = 0.05
confianca = 1 - significancia 

In [20]:
z_alpha = norm.ppf(confianca)
z_alpha

1.6448536269514722

In [21]:
z = (media_amostra - media) / (desvio_padrao_amostra / np.sqrt(n))
z

-1.479019945774904

In [22]:
if z <= -z_alpha:
    print('Rejeitar H0')
else:
    print('Aceitar H0')

Aceitar H0


### Um fabricante de cosméticos afirma que a adição de um novo composto químico em sua linha de shampoos consegue promover em mais de 2 centímetros o crescimento dos fios de cabelo em um período de 60 dias. Duas amostras de pessoas foram selecionadas e testadas, uma utilizando o shampoo novo (com o composto) e a outra com o shampoo antigo (sem o composto).

### Assumindo um nível de confiança de 95% e considerando que as populações se distribuem como uma normal, podemos acreditar na afirmação do fabricante do shampoo? Assinale a alternativa que apresenta a estatística de teste e a decisão correta do teste.

> **$H_0 : \mu1 - \mu2  <= 2$** <br>
> **$H_1 : \mu1 - \mu2  > 2$**

In [23]:
dados = np.array([
    3.4,0.3,
    4.9,1.2,
    2.8,1.2,
    5.5,1.7,
    3.7,1.1,
    2.5,0.6,
    4.3,1.2,
    4.6,1.5,
    3.7,0.5,
    3.4,0.7
])

shampo_novo = dados[0::2]

shampo_antigo = dados[1::2]


In [24]:
n_novo = shampo_novo.shape[0]
n_antigo = shampo_antigo.shape[0]
desvio_padrao_novo = shampo_novo.std()
desvio_padrao_antigo = shampo_antigo.std()

media_novo = shampo_novo.mean()
media_antigo = shampo_antigo.mean()

significancia = 0.05
confianca = 1 - significancia

grau_liberdade = n_novo + n_antigo - 2

D_0 = 2

In [25]:
t_alpha = t_student.ppf(confianca, grau_liberdade)

# $$z = \frac{(\bar{x_1} - \bar{x_2})-D_0}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}$$

In [26]:
numerador = (media_novo - media_antigo) - D_0
denominador = np.sqrt((desvio_padrao_novo**2 / n_novo)+(desvio_padrao_antigo**2 / n_antigo))
t = numerador / denominador

In [27]:
if(t >= t_alpha):
    print('Rejeitar H0')
else:
    print('Aceitar H0')

Rejeitar H0


### Desconfiado da eficiência dos cursos e materiais de estudo online da Alura, um professor resolveu realizar um teste com um grupo de 14 alunos de sua classe. Para isto, ele submeteu estes alunos a duas etapas distintas e logo depois de cada etapa, aplicou uma avaliação. Na etapa inicial, foram oferecidas aulas normais, sem a utilização do material de apoio da Alura. Na segunda etapa, foram também oferecidas aulas normais, mas com a utilização do material de apoio da Alura. As notas obtidas pelos alunos estão na tabela abaixo:
### Assinale a alternativa que apresenta o resultado do teste, não paramétrico de Wilcoxon, aplicado pelo professor (estatística de teste T e decisão do teste). Considere um nível de significância de 10%.

> **$H_0$ : sem alura = com alura** <br>
> **$H_1$ : sem alura < com alura**

In [29]:
import pandas as pd
sem_Alura = pd.Series([ 7,  8, 6, 6, 10, 4, 2, 5,  9, 2, 4, 9, 1, 10])
com_Alura = pd.Series([10, 10, 9, 9,  9, 7, 5, 8, 10, 6, 3, 7, 4,  8])

In [38]:
comparacao = pd.DataFrame({'sem_Alura' : sem_Alura, 'com_Alura' : com_Alura})
significancia = 0.1
comparacao

Unnamed: 0,sem_Alura,com_Alura
0,7,10
1,8,10
2,6,9
3,6,9
4,10,9
5,4,7
6,2,5
7,5,8
8,9,10
9,2,6


In [34]:
from scipy.stats import wilcoxon

In [40]:
T, p_value = wilcoxon(comparacao.sem_Alura, comparacao.com_Alura)
print(T)
print(p_value)

14.0
0.013427734375


In [39]:
p_value < significancia

True

### Um professor acredita que alunos que praticam exercícios físicos têm uma performance média escolar superior àquela obtida por alunos que não praticam. Para provar sua teoria, selecionou duas amostras aleatórias, uma com 9 alunos que não praticam exercícios físicos e outra com 10 alunos que cultivam o hábito de se exercitar. A tabela abaixo mostra as notas dos alunos no último ano:
### Teste a hipótese da média das notas dos alunos que praticam exercícios ser maior que a média das notas dos alunos que não praticam. Assinale a alternativa que apresenta o resultado do teste (estatística de teste u e decisão do teste). Considere um nível de significância de 10%.

> **$H_0$ : sem exercicios = com exercicios** <br>
> **$H_1$ : sem exercicios < com exercicios**

In [54]:
sem_exercicios = pd.Series([7, 6, 7, 8, 6, 8, 6, 9, 5])
com_exercicios = pd.Series([8, 7, 6, 6, 8, 6, 10, 6, 7, 8])
significancia = 0.1
confianca = 1 - significancia

In [55]:
from scipy.stats import mannwhitneyu

In [56]:
u, p_valor = mannwhitneyu(sem_exercicios, com_exercicios, alternative='less')
print(u)
print(p_valor)

40.0
0.35118642828565927


In [57]:
p_valor <= significancia

False