In [1]:
# Importando pacotes
import numpy as np
import statsmodels.stats.api as sms
from math import ceil

# Definindo a diferença de conversão
# Conversão inicial: 13% -> 0.13
# Conversão desejada: 16% -> 0.16
effect_size = sms.proportion_effectsize(0.13, 0.16)
print("Tamanho do efeito (Cohen's h):", effect_size)

# Função para calcular o tamanho da amostra necessária
def calcular_tamanho_amostra(nivel_confianca, power):
    alpha = 1 - nivel_confianca
    required_n = sms.NormalIndPower().solve_power(
        effect_size,
        power=power,   # poder do teste (1 - beta)
        alpha=alpha,   # nível de significância
        ratio=1,       # proporção de amostras entre grupos A e B
        alternative='two-sided'  # teste bilateral
    )
    return ceil(required_n)

# Níveis de confiança e poderes a serem testados
nivel_confiancas = [0.95, 0.99, 0.9999]
powers = [0.80, 0.90]

# Calculando o tamanho da amostra para cada combinação de confiança e poder
for nivel_confianca in nivel_confiancas:
    for power in powers:
        required_n = calcular_tamanho_amostra(nivel_confianca, power)
        print(f"Confiança: {nivel_confianca*100:.2f}% | Poder: {power*100}% -> Tamanho da amostra necessário: {required_n}")


Tamanho do efeito (Cohen's h): -0.08530772368172723
Confiança: 95.00% | Poder: 80.0% -> Tamanho da amostra necessário: 2158
Confiança: 95.00% | Poder: 90.0% -> Tamanho da amostra necessário: 2888
Confiança: 99.00% | Poder: 80.0% -> Tamanho da amostra necessário: 3210
Confiança: 99.00% | Poder: 90.0% -> Tamanho da amostra necessário: 4090
Confiança: 99.99% | Poder: 80.0% -> Tamanho da amostra necessário: 6155
Confiança: 99.99% | Poder: 90.0% -> Tamanho da amostra necessário: 7352


Em outro experimento, tivemos os seguintes resultados:

|-|A - Controle|B - Experimento|
|---|---|---|
|Convertidos|223|45|
|Total|1324|123|


1. Defina as hipóteses para Qui-Quadrado
2. Qual a consequência de um Erro tipo I? E um tipo II?
3. Calcule o p-valor do teste chi-quadrado. Aceitamos ou rejeitamos a hipótese nula? Justifique as consequências da escolha

In [3]:
import numpy as np
from scipy.stats import chi2_contingency

# Criando a tabela de contingência
# [Convertidos, Não Convertidos]
obs = np.array([[223, 1324 - 223], 
                 [45, 123 - 45]])

# Aplicando o teste qui-quadrado
chi2, p, graus_liberdade, ex = chi2_contingency(obs, correction=False)

# Exibindo os resultados
print("expected frequencies:\n ", np.round(ex,2))
print("graus de liberdade: ", graus_liberdade)
print("test stat: %.4f" % chi2)
print("p-valor: %.8f" % p)


expected frequencies:
  [[ 245.22 1078.78]
 [  22.78  100.22]]
graus de liberdade:  1
test stat: 29.0680
p-valor: 0.00000007


1)
- Hipótese Nula (H₀): Não há diferença significativa entre grupo A e do grupo B. Ou seja, a taxa de conversão no grupo controle é igual à do grupo de experimento;
- Hipótese Alternativa (H₁): Existe uma diferença significativa entre as taxas de conversão do grupo de A e do grupo de B. Ou seja, as taxas de conversão são diferentes.

2)
- Erro Tipo I (Falso Positivo): Rejeitar a hipótese nula (H₀) quando ela é verdadeira. A consequência seria concluir que a variação (B) tem um efeito significativo sobre a conversão, quando na verdade não tem. Isso pode levar a implementar mudanças desnecessárias que não melhoram a conversão.

- Erro Tipo II (Falso Negativo): Não rejeitar a hipótese nula (H₀) quando ela é falsa. A consequência seria deixar de identificar uma variação que realmente melhora a conversão, perdendo a oportunidade de otimizar o desempenho do site.

3)

Dado que o p-valor é pequeno ele está muito abaixo dos níveis de significância comuns (0,05, 0,01, e até 0,001). Portanto, rejeitamos a hipótese nula (H₀).
Existe uma diferença significativa entre as taxas de conversão dos grupos de controle e experimento. A variação no grupo B (Experimento) parece ter um efeito real nas conversões.