<a href="https://colab.research.google.com/github/JosenildoJunior/StatPyDataScience/blob/main/Testes_A_B.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Introdução ao Teste A/B**

## **O que é Teste A/B?**

O teste A/B é uma técnica de experimentação utilizada em marketing digital e desenvolvimento de produtos para comparar duas versões de algo, como um site, e-mail, ou aplicativo, com pequenas diferenças entre elas. Ele é usado para determinar qual versão performa melhor em termos de um objetivo específico, como taxas de cliques, conversões, etc.

## **Como funciona ?**

O teste A/B funciona ao direcionar aleatoriamente os usuários para uma das duas versões (A ou B) e coletar dados sobre como cada versão é interagida. Após isso, os resultados são analisados estatisticamente para determinar qual versão é mais eficaz.

## **Benefícios**

Os benefícios do teste A/B incluem a capacidade de tomar decisões informadas baseadas em dados, melhorar a experiência do usuário, e otimizar as taxas de conversão.

## **Exemplos de uso**

O teste A/B é utilizado em uma variedade de contextos, incluindo teste de copywriting, design de página de destino, layout de e-mails, entre outros, para melhorar o desempenho e a eficácia das campanhas de marketing e produtos.

## **Passos para realizar um teste a/b**

Nesse caso, vamos utilizar 4 passos, mas podem existir mais, dependendo da sua realidade.

- **Definição de objetivos e métricas:** É importante identificar claramente os objetivos do nosso experimento. Para medir o sucesso do experimento, é crucial definir métricas específicas que nos permitam avaliar esses objetivos.

- **Abordagem de amostragem:** Uma abordagem de amostragem é essencial para garantir que possamos comparar os resultados de forma justa. Isso nos permitirá avaliar o impacto das mudanças de forma controlada e precisa.

- **Cálculo do tamanho da amostra:** Para garantir que nosso experimento tenha poder estatístico suficiente, é crucial calcular o tamanho da amostra adequadamente. Isso nos ajudará a detectar diferenças significativas entre os grupos.

- **Aplicação do teste de hipótese:** Planejamos aplicar um teste de hipótese para avaliar se as mudanças  apresentam diferenças significativas nas métricas de interesse. Isso nos permitirá tomar decisões informadas com base nos resultados do experimento.

## **Exercícios**

A equipe de marketing do LinkedIn testou duas versões de campanhas por e-mail, A e B, em São Francisco (SF) e na cidade de Nova York (NYC). Dos 100.000 e-mails enviados, 80% dos e-mails eram da versão A, enquanto o restante era da versão B. Aborde as perguntas abaixo para orientar a equipe de marketing.

Dado que a taxa de cliques (CTR) do e-mail A foi de 15%, enquanto a do e-mail B foi de 30%, qual versão é mais eficaz?

Vamos começar criando um df com os valores do problema

In [None]:
# Manipulação de dados
import pandas as pd

# Funções matématicas
import numpy as np

data = {
    'variations': ['a', 'b'],
    'size': [80000, 20000],
    'crt': [15, 30],
    'count': [12000, 6000]
}

# Transformando os dados em df
data = pd.DataFrame(data)

# Exibindo os dados
data

Unnamed: 0,variations,size,crt,count
0,a,80000,15,12000
1,b,20000,30,6000


Importante levarmos em consideração que:

- Size: Tamanho das amostras

- CTR: Percentual de cliques

- Count: Quantidade de cliques

Dito isso vamos definir nossas hipoteses

H0: A = B

Ha: A ≠ B

Estamos diante de um teste bicaudal para proporção logo vamos utilizar o teste z

In [None]:
# Funções matématicas
import numpy as np

# Teste Z
import statsmodels.api as sm

# Dados do problema original
n1 = 80000  # tamanho da amostra A
n2 = 20000  # tamanho da amostra B
x1 = 12000  # número de cliques na amostra A
x2 = 6000   # número de clientes na amostra B

# Calculando o teste Z para a diferença de proporções
Z, p_value = sm.stats.proportions_ztest([x1, x2], [n1, n2])

print("Estatística de teste Z:", Z)
print(f"Valor-p: {p_value}\n")

# Definindo o alpha
alpha = 0.05

# Conclusões
if p_value < alpha:
  print("Rejeitar H0: Há evidências da diferença de proporções entre as amostras A e B.")
else:
  print("Falha em rejeitar H0: Não existe evidências da diferença de proporções entre as amostras A e B.")

Estatística de teste Z: -0.7826255530344017
Valor-p: 0.43384703140074676

Falha em rejeitar H0: Não existe evidências da diferença de proporções entre as amostras A e B.


Apos aplicarmos um teste de hipotese com um nivel de significancia de 0,05, rejeitamos a hipotese nula logo podemos concluir que não temos evidencias suficientes de que as proporções sejam iguais

In [None]:
# Calculando o intervalo de confiança para a versão A
ci_a = sm.stats.proportion_confint(x1, n1, alpha=0.05, method='normal')

# Calculando o intervalo de confiança para a versão B
ci_b = sm.stats.proportion_confint(x2, n2, alpha=0.05, method='normal')

print("Intervalo de confiança para a versão A:", ci_a)
print("Intervalo de confiança para a versão B:", ci_b)

Intervalo de confiança para a versão A: (0.14752566675739073, 0.15247433324260926)
Intervalo de confiança para a versão B: (0.2936489908189888, 0.30635100918101116)


Agora que já temos o intervalo de confiança, podemos afirmar que com 95% de confiança que a proporção para a amostra A está entre 0,14 e 0,15 enquanto para a amostra B esta entre 0,29 e 0,30. Logo podemos concluir que as proporções realmente são bem diferentes, já que nem mesmo existe sobreposição entre os intervalos dessas amostras

Em SF, a CTR do e-mail A foi de 15%, enquanto a do e-mail B foi de 12,5%. Em NYC, a CTR do e-mail A foi de 15%, enquanto a do e-mail B foi de 41,7%. A tabela resumo abaixo mostra o número de e-mails por variação por cidade.

Vamos criar essa tabela utilizando o python

In [None]:
data2 = {
    'variations': ['a - SF', 'b - SF', 'a - NYC', 'b - NYC'],
    'size': [60000, 8000, 20000, 12000],
    'crt': [15, 12.5, 15, 41.7],
    'count': [9000, 1000, 3000, 5000]
}

# Transformando os dados em df
data2 = pd.DataFrame(data2)

# Exibindo os dados
data2

Unnamed: 0,variations,size,crt,count
0,a - SF,60000,15.0,9000
1,b - SF,8000,12.5,1000
2,a - NYC,20000,15.0,3000
3,b - NYC,12000,41.7,5000


Vamos observar se existe diferença entre cada um desses locais, dito isso vamos começar pelo sf

In [None]:
# Funções matématicas
import numpy as np

# Teste Z
import statsmodels.api as sm

# Dados do problema original
n1 = 60000  # tamanho da amostra A
n2 = 8000  # tamanho da amostra B
x1 = 0.15  # número de cliques na amostra A
x2 = 0.125   # número de clientes na amostra B

# Calculando o teste Z para a diferença de proporções
Z, p_value = sm.stats.proportions_ztest([x1, x2], [n1, n2])

print("Estatística de teste Z:", Z)
print(f"Valor-p: {p_value}\n")

# Definindo o alpha
alpha = 0.05

# Conclusões
if p_value < alpha:
  print("Rejeitar H0: Há evidências da diferença de proporções entre as amostras A e B.")
else:
  print("Falha em rejeitar H0: Não existe evidências da diferença de proporções entre as amostras A e B.")

Estatística de teste Z: -0.5483457250488809
Valor-p: 0.5834545362533203

Falha em rejeitar H0: Não existe evidências da diferença de proporções entre as amostras A e B.


In [None]:
# Calculando o intervalo de confiança para a versão A
ci_a = sm.stats.proportion_confint(x1, n1, alpha=0.05, method='normal')

# Calculando o intervalo de confiança para a versão B
ci_b = sm.stats.proportion_confint(x2, n2, alpha=0.05, method='normal')

print("Intervalo de confiança para a versão A:", ci_a)
print("Intervalo de confiança para a versão B:", ci_b)

Intervalo de confiança para a versão A: (0.1471428860726294, 0.15285711392737059)
Intervalo de confiança para a versão B: (0.117752935434662, 0.132247064565338)


In [None]:
# Funções matématicas
import numpy as np

# Teste Z
import statsmodels.api as sm

# Dados do problema original
n1 = 20000  # tamanho da amostra A
n2 = 12000  # tamanho da amostra B
x1 = 3000  # número de cliques na amostra A
x2 = 5000   # número de clientes na amostra B

# Calculando o teste Z para a diferença de proporções
Z, p_value = sm.stats.proportions_ztest([x1, x2], [n1, n2])

print("Estatística de teste Z:", Z)
print(f"Valor-p: {p_value}\n")

# Definindo o alpha
alpha = 0.05

# Conclusões
if p_value < alpha:
  print("Rejeitar H0: Há evidências da diferença de proporções entre as amostras A e B.")
else:
  print("Falha em rejeitar H0: Não existe evidências da diferença de proporções entre as amostras A e B.")

Estatística de teste Z: -53.33333333333334
Valor-p: 0.0

Rejeitar H0: Há evidências da diferença de proporções entre as amostras A e B.


In [None]:
import statsmodels.api as sm

# Dados do problema original
n1_SF = 60000  # tamanho da amostra A em SF
n2_SF = 8000   # tamanho da amostra B em SF
x1_SF = 9000   # número de cliques na amostra A em SF
x2_SF = 1000   # número de cliques na amostra B em SF

n1_NYC = 20000  # tamanho da amostra A em NYC
n2_NYC = 12000  # tamanho da amostra B em NYC
x1_NYC = 3000   # número de cliques na amostra A em NYC
x2_NYC = 5000   # número de cliques na amostra B em NYC

# Calculando o teste Z para a diferença de proporções em SF
Z_SF, p_value_SF = sm.stats.proportions_ztest([x1_SF, x2_SF], [n1_SF, n2_SF])

# Calculando o teste Z para a diferença de proporções em NYC
Z_NYC, p_value_NYC = sm.stats.proportions_ztest([x1_NYC, x2_NYC], [n1_NYC, n2_NYC])

print("Estatística de teste Z para SF:", Z_SF)
print("Valor-p para SF:", p_value_SF)
print("Estatística de teste Z para NYC:", Z_NYC)
print("Valor-p para NYC:", p_value_NYC)

# Definindo o alpha
alpha = 0.05

# Conclusões
if p_value_SF < alpha:
  print("Rejeitar H0 para SF: Há evidências da diferença de proporções entre as amostras A e B em SF.")
else:
  print("Falha em rejeitar H0 para SF: Não existe evidências da diferença de proporções entre as amostras A e B em SF.")

if p_value_NYC < alpha:
  print("Rejeitar H0 para NYC: Há evidências da diferença de proporções entre as amostras A e B em NYC.")
else:
  print("Falha em rejeitar H0 para NYC: Não existe evidências da diferença de proporções entre as amostras A e B em NYC.")


Estatística de teste Z para SF: 5.930633506894811
Valor-p para SF: 3.017680994773782e-09
Estatística de teste Z para NYC: -53.33333333333334
Valor-p para NYC: 0.0
Rejeitar H0 para SF: Há evidências da diferença de proporções entre as amostras A e B em SF.
Rejeitar H0 para NYC: Há evidências da diferença de proporções entre as amostras A e B em NYC.


In [None]:
# Dados do problema original
n1_SF = 60000  # tamanho da amostra A em SF
n2_SF = 8000   # tamanho da amostra B em SF
x1_SF = 9000   # número de cliques na amostra A em SF
x2_SF = 1000   # número de cliques na amostra B em SF

# Calculando o teste Z para a diferença de proporções em SF
Z_SF, p_value_SF = sm.stats.proportions_ztest([x1_SF, x2_SF], [n1_SF, n2_SF])

print("Estatística de teste Z para SF:", Z_SF)
print("Valor-p para SF:", p_value_SF)

Estatística de teste Z para SF: 5.930633506894811
Valor-p para SF: 3.017680994773782e-09


In [None]:
import statsmodels.api as sm

# Dados do problema original
n1_SF = 60000  # tamanho da amostra A em SF
p1_SF = 0.15    # CTR da amostra A em SF
n2_SF = 1000   # tamanho da conversão B em SF
p2_SF = 0.125  # CTR da amostra B em SF

# Calculando o teste Z para a diferença de proporções em SF
Z_SF, p_value_SF = sm.stats.proportions_ztest([n1_SF * p1_SF, n2_SF * p2_SF], [n1_SF, n2_SF])

print("Estatística de teste Z para SF:", Z_SF)
print("Valor-p para SF:", p_value_SF)


Estatística de teste Z para SF: 2.1982903828568574
Valor-p para SF: 0.027928419304733828


## **Exercícios 2**

Uma empresa comercializa um programa de perda de peso de oito semanas e afirma que no final do programa, em média, um participante terá perdido 5 kg. Por outro lado, você estudou o programa e acredita que o programa deles é cientificamente infundado e não deveria funcionar. Com algum financiamento limitado em mãos, você quer testar a hipótese de que o programa de perda de peso não ajuda as pessoas a perder peso.

Seu plano é obter uma amostra aleatória de pessoas e colocá-las no programa. Você medirá seu peso no início do programa e, em seguida, medirá seu peso novamente no final do programa. Com base em algumas pesquisas anteriores, você acredita que o desvio padrão da diferença de peso ao longo de oito semanas será de 5 kg. Agora você quer saber quantas pessoas devem se inscrever no programa para testar sua hipótese.

H0: perda de peso = 5 kilos

Ha: perda de peso != 5 kilos

Estamos diantes de um teste bicaudal

Importante frisar que teremos duas amostras dependentes sendo uma antes e uma depois, como conhecemos o desvio padrão podemos aplicar um teste t para duas amostras