Um fabricante de cosméticos afirma que a adição de um novo composto químico em sua linha de shampoos consegue promover em mais de 2 centímetros o crescimento dos fios de cabelo em um período de 60 dias. Duas amostras de pessoas foram selecionadas e testadas, uma utilizando o shampoo novo (com o composto) e a outra com o shampoo antigo (sem o composto).

Os resultados (crescimento dos fios de cabelo em centímetros) podem ser verificados na tabela abaixo:


Assumindo um nível de confiança de 95% e considerando que as populações se distribuem como uma normal, podemos acreditar na afirmação do fabricante do shampoo? Assinale a alternativa que apresenta a estatística de teste e a decisão correta do teste.

Um pouco mais de teoria: como se trata de um problema um pouco diferente do apresentado em nossa aula, vamos esclarecer alguns pontos para ajudar na solução:

1) Em testes entre duas amostras, quando realizamos a escolha da distribuição amostral adequada (passo 2) e perguntamos se n ≥ 30, temos que considerar que n = n1 + n2, onde n1 é o tamanho da primeira amostra e n2 o tamanho da segunda;

2) Quando n1 + n2 ≥ 30, utilizamos z (normal), e quando n1 + n2 < 30, σ não for conhecido e as populações forem normalmente distribuídas, utilizamos t (t-Student);

3) Quando utilizamos a tabela t de Student, em teste de duas amostras, os graus de liberdade são obtidos da seguinte forma: n1 + n2 - 2;

4) Quando o problema nos pergunta se podemos acreditar na afirmação do fabricante, está nos indicando o que devemos testar, ou seja, a nossa hipótese alternativa (H1), que no caso é:

Onde:

μ1 = Crescimento médio dos cabelos com o uso do novo shampoo μ2 = Crescimento médio dos cabelos com o uso do shampoo antigo.

In [21]:
from scipy.stats import norm
import numpy as np

confianca = 0.95
significancia = 1 - confianca
probabilidade = confianca + (significancia)/ 2

z = 1.65
media_amostral = 330
desvio_pad = 80
n = 35

μ = z *  (desvio_pad / np.sqrt(n))
print(f'Com uma confiança de 95% a média populacional está no intervalo: {media_amostral - μ:.3f} <= μ <= {media_amostral + μ:.3f}')

z_teste = (350 - media_amostral) / (desvio_pad/np.sqrt(n))
print(f'A estatística do teste é igual a: {z_teste}')
#Com uma confiança de 95% a média populacional está no intervalo: 51.052 <= μ <= 51.548

Com uma confiança de 95% a média populacional está no intervalo: 307.688 <= μ <= 352.312
A estatística do teste é igual a: 1.479019945774904


In [None]:
Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))

Sabe-se que a vida em horas de um bulbo de lâmpada de 75 W é distribuída de forma aproximadamente normal com desvio padrão de σ = 25. Uma amostra aleatória de 200 bulbos tem uma vida media de 1.014 horas. Construa um intervalo de confiança de 95% para a vida média.

In [3]:
from scipy.stats import norm
import numpy as np

confianca = 0.95
significancia = 1 - confianca
probabilidade = confianca + (significancia)/ 2

z = 1.96
media_amostral = 1014
desvio_pad = 25
n = 200

μ = z *  (desvio_pad / np.sqrt(n))
print(f'Com uma confiança de 95% a vida média populacional está no intervalo: {media_amostral - μ:.3f} <= μ <= {media_amostral + μ:.3f}')

#Com uma confiança de 95% a vida média populacional está no intervalo: 1010.535 <= μ <= 1017.465

Com uma confiança de 95% a vida média populacional está no intervalo: 1010.535 <= μ <= 1017.465


Qual deve ser o tamanho da amostra para que o intervalo com 99,5% de confiança para a média populacional tenha uma semi-amplitude (ou erro) não superior a 1,5? Sabe-se que a variância populacional é de 23.

In [4]:
from scipy.stats import norm
import numpy as np

confianca = 0.995
significancia = 1 - confianca
probabilidade = confianca + (significancia)/ 2

z = norm.ppf(probabilidade)
desvio_pad = 23
erro = 1.5

n =  (desvio_pad / (erro / z))**2
print(f'O tamanho da amostra para que a semi amplitude do intervalo de 99,5% de confiança da média populacional não seja superior a 1.5, deve ser menor que: {n:.2f}')

#O tamanho da amostra para que a semi amplitude do intervalo de 99,5% de confiança da média populacional não seja superior a 1.5, deve ser menor que: 1852.54

O tamanho da amostra para que a semi amplitude do intervalo de 99,5% de confiança da média populacional não seja superior a 1.5, deve ser menor que: 1852.54


Uma marca particular de margarina diet foi analisada para determinar o nível em porcentagem de ácidos graxos insaturados. Uma amostra de seis pacotes resultou nos seguintes dados: 16,8; 17,2; 17,4; 16,9; 16,5 e 17,1. Encontre o intervalo de confiança de 99% para a amostra.

In [6]:
from scipy.stats import norm
import numpy as np

dados = [16.8, 17.2, 17.4, 16.9, 16.5, 17.1]

confianca = 0.99
significancia = 1 - confianca
probabilidade = confianca + (significancia)/ 2

t = 4.0321 #Encontrado procurando na tabela da distribuição t-student para graus de liberdade = 5 e probabilidade = 0.995
media_amostral = np.mean(dados)
desvio_pad = np.std(dados)
n = len(dados)

μ = t *  (desvio_pad / np.sqrt(n))
print(f'Com uma confiança de 99% a vida média populacional está no intervalo: {media_amostral - μ:.3f} <= μ <= {media_amostral + μ:.3f}')

#Com uma confiança de 99% a média populacional está no intervalo: 16.504 <= μ <= 17.462

Com uma confiança de 99% a vida média populacional está no intervalo: 16.504 <= μ <= 17.462


Uma amostra piloto com 12 elementos tem média de 6,7 e desvio padrão de 1,7. Qual deve ser o tamanho da amostra para que a semi amplitude do intervalo de 99,5% de confiança da média populacional não seja superior a 0,8.

In [7]:
from scipy.stats import norm

confianca = 0.995
significancia = 1 - confianca
probabilidade = confianca + (significancia)/ 2

z = norm.ppf(probabilidade)
media_amostral = 6.7
desvio_pad = 1.7
n = 12

n =  (desvio_pad / (0.8 / z))**2
print(f'O tamanho da amostra para que a semi amplitude do intervalo de 99,5% de confiança da média populacional não seja superior a 0.8, deve ser menor que: {n:.2f}')

#O tamanho da amostra para que a semi amplitude do intervalo de 99,5% de confiança da média populacional não seja superior a 0.8, deve ser menor que: 35.58

O tamanho da amostra para que a semi amplitude do intervalo de 99,5% de confiança da média populacional não seja superior a 0,8, deve ser menor que: 35.58


Calcular o intervalo de confiança de 95% para a seguinte amostra, com variância populacional desconhecida:

19,8; 18,5; 17,6; 16,7; 15,8; 15,4; 14,1; 13,6; 11,9; 11,4; 11,4; 8,8; 7,5; 15,4; 15,4; 19,5; 14,9; 12,7; 11,9; 11,4; 10,1; 7,9

In [9]:
from scipy.stats import norm
import numpy as np

dados = [19.8, 18.5, 17.6, 16.7, 15.8, 15.4, 14.1, 13.6, 11.9, 11.4, 11.4, 8.8, 7.5, 15.4, 15.4, 19.5, 14.9, 12.7, 11.9, 11.4, 10.1, 7.9]

confianca = 0.95
significancia = 1 - confianca
probabilidade = confianca + (significancia)/ 2

t = 2.0796 #Encontrado procurando na tabela da distribuição t-student para graus de liberdade = 21 e probabilidade = 0.975
media_amostral = np.mean(dados)
desvio_pad = np.std(dados)
n = len(dados)

μ = t *  (desvio_pad / np.sqrt(n))
print(f'Com uma confiança de 95% a média populacional está no intervalo: {media_amostral - μ:.3f} <= μ <= {media_amostral + μ:.3f}')

#Com uma confiança de 95% a média populacional está no intervalo: 12.174 <= μ <= 15.253

Com uma confiança de 95% a média populacional está no intervalo: 12.174 <= μ <= 15.253
