<a href="https://colab.research.google.com/github/AntonioMenezes07/teste_A-B/blob/main/teste_A_B.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#**Teste A/B**

##**O que é o Teste A/B?**
O Teste A/B, também conhecido como Split Testing, é um método experimental que compara duas versões de um mesmo elemento para determinar qual delas performa melhor. Em sua essência, ele envolve mostrar a duas diferentes amostras de usuários (ou público-alvo) uma versão distinta (A ou B) de algo, como uma página da web, um e-mail, um anúncio, um recurso de produto, etc., e então medir qual versão gera os melhores resultados para um objetivo específico.

##**Como funciona?**
**Definição do Objetivo:** Primeiramente, você precisa ter um objetivo claro e mensurável. Por exemplo, aumentar a taxa de cliques (CTR) em um botão, melhorar a taxa de conversão em uma página de vendas, ou reduzir a taxa de rejeição.

**Criação das Versões:** Crie duas versões do elemento que você deseja testar. A Versão A (controle) é a versão existente ou original, enquanto a Versão B (variação) é a versão com a modificação que você acredita que pode trazer melhorias.

**Divisão do Tráfego:** O tráfego de usuários é dividido aleatoriamente entre as duas versões. Metade (ou outra proporção definida) dos usuários verá a Versão A, e a outra metade verá a Versão B. É crucial que a divisão seja aleatória para garantir que as amostras sejam comparáveis e que fatores externos não influenciem os resultados.

**Coleta e Análise de Dados:** Durante um período pré-determinado, os dados de desempenho de ambas as versões são coletados. Isso pode incluir cliques, conversões, tempo na página, etc. Após a coleta, técnicas estatísticas são aplicadas para determinar se a diferença nos resultados entre a Versão A e a Versão B é estatisticamente significativa, ou seja, se não é apenas resultado do acaso.

**Tomada de Decisão:** Com base na análise estatística, uma decisão é tomada. Se a Versão B performou significativamente melhor, ela pode ser implementada para todos os usuários. Se não houve diferença significativa, ou a Versão A foi melhor, você pode descartar a mudança ou testar outras variações.


##**Por que usar Testes A/B?**
Os Testes A/B são ferramentas poderosas para a otimização, pois permitem que as equipes tomem decisões baseadas em dados concretos, em vez de suposições ou intuições. Eles são amplamente utilizados em marketing digital, desenvolvimento de produtos, design de interfaces e muitas outras áreas para otimizar a experiência do usuário e impulsionar métricas de negócios.

##**Uma forma descomplicada de entender o valor-p:**
Supondo que a diferença entre o cenário A e o cenário B não seja relevante, o valor-p representa a chance de essa diferença ser apenas fruto do acaso. Por padrão, o valor crítico é 5%. Ou seja:

Se o valor-p for menor que 5%, é improvável que a diferença seja apenas sorte, então rejeitamos H₀ (há indícios de que a diferença é real).

Se o valor-p for maior que 5%, é provável que a diferença seja por acaso, então não rejeitamos H₀ (a diferença não é significativa).

Definição das hipóteses:

H₀: X é igual a Y

H₁: X é diferente de Y

Portanto, se o valor-p for menor que 5%, podemos dizer que a diferença entre X e Y é estatisticamente significativa. Caso contrário, não há evidência suficiente para afirmar que X e Y são diferentes.

# **entendimento do projeto:**
neste projeto sera realizado alguns testes A/B para diversas situacoes, entre elas:
- Avaliação de Design de Site
- Preços
- Avaliação de Email Marketing
- Avaliação de Tempo no Site
-  Avaliação de Taxa de Rejeição.

**OBS:** para cada situacao foi definido duas hipoteses:
###H0: X e igual a Y
###H1: X  e diferente de Y



#**importação de biblioteca**

In [10]:
from statsmodels.stats.proportion import proportions_ztest
from scipy.stats import ttest_ind_from_stats
import numpy as np

#**1 - Avaliação de Design de Site**

 **descricao:**
 Uma empresa de e-commerce deseja avaliar se um novo design de sua página de produto leva a uma maior taxa de cliques (CTR) em seus produtos. Durante uma semana, eles mostraram o design antigo a 1.000 visitantes e o novo design a 1.000 outros visitantes. O design antigo levou a 150 cliques, enquanto o novo design levou a 180 cliques.



In [6]:
#visitantes
n_a = 1000
n_b = 1000

#numero de conversao
conversions_A = 150
conversions_B = 180

# Dados
count = np.array([conversions_A, conversions_B])
nobs = np.array([n_a, n_b])

# Usando a função proportions_ztest
z_value, p_value_statsmodels = proportions_ztest(count, nobs)

z_value, p_value_statsmodels
print(f'Z-value: {z_value:.4f}')
print(f'P-value: {p_value_statsmodels:.4f}')

Z-value: -1.8073
P-value: 0.0707


Como o valor-p foi maior que 0,05, não podemos rejeitar a hipótese de que o novo design tem o mesmo número de cliques que o design antigo.
Portanto, não há evidência estatística suficiente para afirmar que o novo design é melhor.

#**2 - Teste A/B para Preços**


Uma empresa SaaS (Software as a Service) está considerando aumentar o preço de sua assinatura mensal de 20 reais para 25 reais. Eles testam a nova estrutura de preços em 500 visitantes e mantêm o preço antigo para outros 500 visitantes. Com o preço antigo, 200 usuários se inscreveram, enquanto com o novo preço, 180 usuários se inscreveram. O novo preço é vantajoso para a empresa?

In [7]:
#visitantes
n_a = 500
n_b = 500

#numero de conversao
conversions_A = 200
conversions_B = 180
# Dados
count = np.array([conversions_A, conversions_B])
nobs = np.array([n_a, n_b])

# Usando a função proportions_ztest
z_value, p_value_statsmodels = proportions_ztest(count, nobs)

z_value, p_value_statsmodels
print(f'Z-value: {z_value:.4f}')
print(f'P-value: {p_value_statsmodels:.4f}')

Z-value: 1.3030
P-value: 0.1926


Como o valor-p foi superior a 0,05, não podemos descartar a hipótese de que os dois preços são iguais.
Portanto, não há evidência estatística suficiente para afirmar que o novo preço é melhor.

#**3 - Avaliação de Email Marketing**


Uma empresa de varejo online decidiu testar duas versões diferentes de um email promocional. O email da Versão A foi enviado para 2.000 clientes e teve uma taxa de abertura de 20%. O email da Versão B foi enviado para 2.500 clientes e teve uma taxa de abertura de 22%. Qual versão do email teve melhor desempenho?

In [9]:
# numero de emails enviados
n_a = 2000
n_b = 2500

# taxa de abertura
conversions_A = 400
conversions_B = 550

# Dados
count = np.array([conversions_A, conversions_B])
nobs = np.array([n_a, n_b])

# Usando a função proportions_ztest
z_value, p_value_statsmodels = proportions_ztest(count, nobs)

z_value, p_value_statsmodels
print(f'Z-value: {z_value:.4f}')
print(f'P-value: {p_value_statsmodels:.4f}')

Z-value: -1.6336
P-value: 0.1023


Como o valor-p foi superior a 0,05, não podemos descartar a hipótese de que os dois tipos de e-mails são equivalentes.
Portanto, não há evidência estatística suficiente para afirmar que o novo e-mail é melhor.

#**4 - Avaliação de Tempo no Site**

Uma plataforma de notícias online implementou uma nova característica que sugere artigos relacionados ao usuário. Eles querem testar se essa característica aumenta o tempo médio que um usuário passa no site. Eles implementam o novo recurso para 1.500 usuários e veem um tempo médio de permanência de 5,2 minutos, com um desvio padrão de 1,5 minutos. Para 1.700 usuários sem o novo recurso, o tempo médio de permanência foi de 5 minutos com um desvio padrão de 1,4 minutos. A nova característica fez alguma diferença?



In [11]:
# Média, desvio padrão e tamanho das amostras
media_com_recurso = 5.2
dp_com_recurso = 1.5
n_com_recurso = 1500

media_sem_recurso = 5.0
dp_sem_recurso = 1.4
n_sem_recurso = 1700

# Teste t com os dados estatísticos (sem gerar dados aleatórios)
t_stat, p_valor = ttest_ind_from_stats(
    mean1=media_com_recurso, std1=dp_com_recurso, nobs1=n_com_recurso,
    mean2=media_sem_recurso, std2=dp_sem_recurso, nobs2=n_sem_recurso,
    equal_var=False  # variâncias diferentes
)

print("Estatística t:", t_stat)
print("Valor p:", p_valor)

Estatística t: 3.882989225005368
Valor p: 0.000105345216584296


Como o valor-p foi inferior a 0,05, pode-se afirmar que existe uma diferença significativa entre as duas situações.
Portanto, o novo recurso deve ser implementado.

 # **5 - Avaliação de Taxa de Rejeição**

Uma empresa de software deseja testar se um novo tutorial de introdução ao seu software reduz a taxa de rejeição de novos usuários.

Com tutorial: 1.200 usuários, dos quais 400 abandonaram o software no primeiro uso.

Sem tutorial: 1.100 usuários, dos quais 500 abandonaram no primeiro uso.

A pergunta é: o tutorial fez alguma diferença estatisticamente significativa na taxa de rejeição?

In [12]:
# numero de usuarios
n_a = 1200
n_b = 1100

# taxa de abertura
conversions_A = 400
conversions_B = 500

# Dados
count = np.array([conversions_A, conversions_B])
nobs = np.array([n_a, n_b])

# Usando a função proportions_ztest
z_value, p_value_statsmodels = proportions_ztest(count, nobs)

z_value, p_value_statsmodels
print(f'Z-value: {z_value:.4f}')
print(f'P-value: {p_value_statsmodels:.4f}')

Z-value: -5.9499
P-value: 0.0000


Como o valor-p foi muito inferior a 0,05, pode-se afirmar que a presença do tutorial faz diferença e, portanto, deve ser implementada.