# Duas Amostras - Shampoo

Um fabricante de cosméticos afirma que a adição de um novo composto químico em sua linha de shampoos consegue promover em mais de 2 centímetros o crescimento dos fios de cabelo em um período de 60 dias. Duas amostras de pessoas foram selecionadas e testadas, uma utilizando o shampoo novo (com o composto) e a outra com o shampoo antigo (sem o composto).

Os resultados (crescimento dos fios de cabelo em centímetros) podem ser verificados na tabela abaixo:

In [None]:
import pandas as pd
import numpy as np

In [None]:
shampoo_novo = pd.Series([3.4, 4.9, 2.8, 5.5, 3.7, 2.5, 4.3, 4.6, 3.7, 3.4])
shampoo_novo

0    3.4
1    4.9
2    2.8
3    5.5
4    3.7
5    2.5
6    4.3
7    4.6
8    3.7
9    3.4
dtype: float64

In [None]:
shampoo_antigo = pd.Series([0.3, 1.2, 1.2, 1.7, 1.1, 0.6, 1.2, 1.5, 0.5, 0.7])
shampoo_antigo

0    0.3
1    1.2
2    1.2
3    1.7
4    1.1
5    0.6
6    1.2
7    1.5
8    0.5
9    0.7
dtype: float64

Assumindo um nível de confiança de 95% e considerando que as populações se distribuem como uma normal, podemos acreditar na afirmação do fabricante do shampoo?

In [None]:
confianca = 0.95
significancia = 1 - confianca
d_0 = 2

In [None]:
media_shampoo_novo = shampoo_novo.mean()
media_shampoo_novo

3.88

In [None]:
media_shampoo_antigo = shampoo_antigo.mean()
media_shampoo_antigo

1.0

In [None]:
desvio_padrao_shampoo_novo = shampoo_novo.std()
desvio_padrao_shampoo_novo

0.9402127418834527

In [None]:
desvio_padrao_shampoo_antigo = shampoo_antigo.std()
desvio_padrao_shampoo_antigo

0.4546060565661952

In [None]:
n_shampoo_novo = len(shampoo_novo)
n_shampoo_antigo = len(shampoo_antigo)

if n_shampoo_novo + n_shampoo_antigo < 30:
    print("Usar t (t-Student)")
else:
    print("Usar z (normal")

Usar t (t-Student)


In [None]:
import pandas as pd
from scipy.stats import t as t_student

tabela_t_student = pd.DataFrame(
    [],
    index=[i for i in range(1, 30)],
    columns=[i / 100 for i in range(10, 0, -1)]
)

for index in tabela_t_student.index:
    for column in tabela_t_student.columns:
        tabela_t_student.loc[index, column] = t_student.ppf(1 - float(column) / 2, index)

index = [("Graus de Liberdade (n - 1)", i) for i in range(1, 30)]
tabela_t_student.index = pd.MultiIndex.from_tuples(index)

columns = [(f"{i / 100:0.3f}", f"{(i / 100) / 2:0.3f}") for i in range(10, 0, -1)]
tabela_t_student.columns = pd.MultiIndex.from_tuples(columns)

tabela_t_student.rename_axis(["Bicaudal", "Unicaudal"], axis=1, inplace=True)

tabela_t_student

Unnamed: 0_level_0,Bicaudal,0.100,0.090,0.080,0.070,0.060,0.050,0.040,0.030,0.020,0.010
Unnamed: 0_level_1,Unicaudal,0.050,0.045,0.040,0.035,0.030,0.025,0.020,0.015,0.010,0.005
Graus de Liberdade (n - 1),1,6.313752,7.026366,7.915815,9.057887,10.578895,12.706205,15.894545,21.204949,31.820516,63.656741
Graus de Liberdade (n - 1),2,2.919986,3.103977,3.319764,3.578247,3.896425,4.302653,4.848732,5.642778,6.964557,9.924843
Graus de Liberdade (n - 1),3,2.353363,2.470807,2.605427,2.762599,2.95051,3.182446,3.481909,3.896046,4.540703,5.840909
Graus de Liberdade (n - 1),4,2.131847,2.2261,2.332873,2.455892,2.600762,2.776445,2.998528,3.29763,3.746947,4.604095
Graus de Liberdade (n - 1),5,2.015048,2.097837,2.190958,2.297392,2.421585,2.570582,2.756509,3.002875,3.36493,4.032143
Graus de Liberdade (n - 1),6,1.94318,2.019201,2.104306,2.201059,2.313263,2.446912,2.612242,2.828928,3.142668,3.707428
Graus de Liberdade (n - 1),7,1.894579,1.966153,2.046011,2.136453,2.240879,2.364624,2.516752,2.714573,2.997952,3.499483
Graus de Liberdade (n - 1),8,1.859548,1.927986,2.004152,2.090166,2.189155,2.306004,2.448985,2.633814,2.896459,3.355387
Graus de Liberdade (n - 1),9,1.833113,1.899222,1.972653,2.055395,2.150375,2.262157,2.398441,2.573804,2.821438,3.249836
Graus de Liberdade (n - 1),10,1.812461,1.876774,1.948099,2.028327,2.120234,2.228139,2.359315,2.527484,2.763769,3.169273


In [None]:
from scipy.stats import t as t_student

In [None]:
graus_de_liberdade = n_shampoo_novo + n_shampoo_antigo - 2
t_alpha = t_student.ppf(confianca, graus_de_liberdade)
t_alpha

1.7340636066175354

In [None]:
numerador = (media_shampoo_novo - media_shampoo_antigo) - d_0
denominador = np.sqrt((desvio_padrao_shampoo_novo ** 2 / n_shampoo_novo) + (desvio_padrao_shampoo_antigo ** 2 / n_shampoo_antigo))
t = numerador / denominador
p_valor = t_student.sf(t, graus_de_liberdade)
print(t.round(3), p_valor.round(3), graus_de_liberdade)

2.665 0.008 18


In [None]:
print(f"Hipótese Nula H0 (média de crescimento do shampoo novo menor ou igual a 2 cm em relação ao shampoo antigo): {'Rejeitada' if t >= t_alpha else 'Não Rejeitada'}")

Hipótese Nula H0 (média de crescimento do shampoo novo menor ou igual a 2 cm em relação ao shampoo antigo): Rejeitada


In [None]:
from statsmodels.stats.weightstats import DescrStatsW
    
test_a = DescrStatsW(shampoo_novo)
test_b = DescrStatsW(shampoo_antigo)
    
test = test_a.get_compare(test_b)
    
t, p_valor, df = test.ttest_ind(value=d_0, alternative="larger")
    
print(t.round(3), p_valor.round(3), df)

2.665 0.008 18.0


In [None]:
print(f"Hipótese Nula H0 (média de crescimento do shampoo menor ou igual a 2 cm em relação ao shampoo antigo): {'Rejeitada' if t >= t_alpha else 'Não Rejeitada'}")

Hipótese Nula H0 (média de crescimento do shampoo menor ou igual a 2 cm em relação ao shampoo antigo): Rejeitada
