# 0.0 - Imports

In [10]:
import pandas as pd
import numpy  as np

from statsmodels.stats import proportion, power

## 0.1 - Carregamento dos Dados

In [2]:
# Armazenamento dos Dados
dataframe = {'page_variant_button': ['interact', 'connect', 'learn', 'help', 'services'], 
             'visitantes': [10283, 2742, 2747, 3180, 2064],
             'clicks':[3714, 1587, 1652, 1717, 1348],
             'clicks_button': [42, 53, 21, 38, 45]}

# Armazenamento dos Dados em um DataFrame
df_raw = pd.DataFrame(dataframe)

# Exibição dos dados
df_raw.head()

Unnamed: 0,page_variant_button,visitantes,clicks,clicks_button
0,interact,10283,3714,42
1,connect,2742,1587,53
2,learn,2747,1652,21
3,help,3180,1717,38
4,services,2064,1348,45


# 1.0 - Escolha do Método 

Nesse experimento que estamos realizando, nós queremos saber qual botão, que no caso são "Connect", "Help" e "Services", é melhor que o "Interact", uma vez que nós já sabemos que esses botões tem um impacto na taxa de cliques. Assim, vamos realizar o teste dois a dois em relação ao botão interact. Para isso, utilizaremos um teste A/B para validar a efetividade desses botões.


**Qual é o objetivo do teste?**

- Objetivo deste teste é verificar se taxa de cliques entre os botões "Connect", "Help" e "Services" é melhor em relação ao botão "Interact".

**Qual é o tipo dos dados?**

- Os dados são numéricos.

**Qual o foco do teste?**

- O foco do teste está em observar um diferença na proporção de cliques em relação aos botões mencionados.

**Quantos grupos estarão em cada teste?**

- Serão realizados teste de dois a dois, em relação ao botão "Interact".

**Conclusão de Inferência a ser Utilizada:** Portanto, o teste a ser utilizado nessa situação é o Two-Proportion Z-Test.

# 2.0 - Design de Experimento

## 2.1 - Formulação das Hipóteses

### Botões "Connect" e "Interact"

**Determinação da Métrica:** A taxa de cliques nos botões.

**Hipótese Nula:** Não há diferença entre as taxas de cliques do botão "Interact" e "Connect".

**Hipótese Alternatica:** A taxa de cliques do botão "Connect" é maior que a do botão "Interact".

### Botões "Help" e "Interact"

**Determinação da Métrica:** A taxa de cliques nos botões.

**Hipótese Nula:** Não há diferença entre as taxas de cliques do botão "Interact" e "Help".

**Hipótese Alternatica:** A taxa de cliques do botão "Help" é maior que a do botão "Interact".

### Botões "Services" e "Interact"

**Determinação da Métrica:** A taxa de cliques nos botões.

**Hipótese Nula:** Não há diferença entre as taxas de cliques do botão "Interact" e "Services".

**Hipótese Alternatica:** A taxa de cliques do botão "Services" é maior que a do botão "Interact".

## 2.2 - Tamanho da Amostra

In [15]:
tabela = df_raw.copy()
tabela['ctr'] = df_raw['clicks_button']/df_raw['clicks']

###  Botões Connect e Interact

In [16]:
# ---------------------- Determinação dos Parâmetros ----------------------------

# nivel de confiança
nivel_confianca = 0.95

# Nivel de Significância 
nivel_significancia = 1 - nivel_confianca

# poder estatístico
power_stats  = 0.80


# -------------------- Tamanho do efeito ----------------------------

# Tomando as proporções de cada página
prop_control   = tabela.loc[0, 'ctr']
prop_treatment = tabela.loc[1, 'ctr']

# Calculando o effect size
effect_size = proportion.proportion_effectsize(prop_control, prop_treatment)


# -------------------- Tamanho da amostra ----------------------------

# Calculando o tamanho da amostra.
sample_size = power.zt_ind_solve_power(effect_size=effect_size, 
                                       alpha=nivel_significancia, 
                                       power=power_stats, 
                                       alternative='smaller')

# exibição
print(f'O tamanho da amostra tem que ser no mínimo de {int(np.ceil(sample_size))}.')

O tamanho da amostra tem que ser no mínimo de 519.


###  Botões Help e Interact

In [21]:
# ---------------------- Determinação dos Parâmetros ----------------------------

# nivel de confiança
nivel_confianca = 0.95

# Nivel de Significância 
nivel_significancia = 1 - nivel_confianca

# poder estatístico
power_stats  = 0.80


# -------------------- Tamanho do efeito ----------------------------

# Tomando as proporções de cada página
prop_control   = tabela.loc[0, 'ctr']
prop_treatment = tabela.loc[3, 'ctr']

# Calculando o effect size
effect_size = proportion.proportion_effectsize(prop_control, prop_treatment)


# -------------------- Tamanho da amostra ----------------------------

# Calculando o tamanho da amostra.
sample_size = power.zt_ind_solve_power(effect_size=effect_size, 
                                       alpha=nivel_significancia, 
                                       power=power_stats, 
                                       alternative='smaller')

# exibição
print(f'O tamanho da amostra tem que ser no mínimo de {int(np.ceil(sample_size))}.')

O tamanho da amostra tem que ser no mínimo de 1690.


###  Botões Services e Interact

In [22]:
# ---------------------- Determinação dos Parâmetros ----------------------------

# nivel de confiança
nivel_confianca = 0.95

# Nivel de Significância 
nivel_significancia = 1 - nivel_confianca

# poder estatístico
power_stats  = 0.80


# -------------------- Tamanho do efeito ----------------------------

# Tomando as proporções de cada página
prop_control   = tabela.loc[0, 'ctr']
prop_treatment = tabela.loc[4, 'ctr']

# Calculando o effect size
effect_size = proportion.proportion_effectsize(prop_control, prop_treatment)


# -------------------- Tamanho da amostra ----------------------------

# Calculando o tamanho da amostra.
sample_size = power.zt_ind_solve_power(effect_size=effect_size, 
                                       alpha=nivel_significancia, 
                                       power=power_stats, 
                                       alternative='smaller')

# exibição
print(f'O tamanho da amostra tem que ser no mínimo de {int(np.ceil(sample_size))}.')

O tamanho da amostra tem que ser no mínimo de 519.


# 3.0 - Preparação e Coleta dos Dados 

## Botões Connect e Interact

In [45]:
# Extraindo os dados necessários
tabela_connect_interact = tabela[['clicks_button', 'clicks']].iloc[0:2]

# Renomeando as colunas
tabela_connect_interact = tabela_connect_interact.rename(columns = {'clicks_button': 'sucesso', 'clicks' : 'observacoes'})

## Botões Help e Interact

In [46]:
# Extraindo os dados necessários
tabela_help_interact = tabela[['clicks_button', 'clicks']].iloc[0:4:3]

# Renomeando as colunas
tabela_help_interact = tabela_help_interact.rename(columns = {'clicks_button': 'sucesso', 'clicks' : 'observacoes'})

## Botões Services e Interact

In [47]:
# Extraindo os dados necessários
tabela_services_interact = tabela[['clicks_button', 'clicks']].iloc[0:5:4]

# Renomeando as colunas
tabela_services_interact = tabela_services_interact.rename(columns = {'clicks_button': 'sucesso', 'clicks' : 'observacoes'})

# 4.0 - Teste de Hipótese

## Botões Connect e Interact

In [58]:
# Aplicação do Two Proportion Z-Test
z_score, p_valor_connect = proportion.proportions_ztest(np.array(tabela_connect_interact['sucesso']), 
                                                        np.array(tabela_connect_interact['observacoes']),
                                                        alternative='smaller') 

print('P-Valor: {}.'.format(p_valor_connect))
if p_valor < 0.05:
    print('Rejeitamos a hipótese nula. Ou seja, concluímos que o botão connect é melhor que o botão interact')
else:
    print('Falhamos em rejeitar a hipótese nula. Isto é, concluímos que não há diferença entre as taxas de cliques dos botões.')

P-Valor: 1.4144650329798615e-08.
Rejeitamos a hipótese nula. Ou seja, concluímos que o botão connect é melhor que o botão interact


## Botões Help e Interact

In [59]:
# Aplicação do Two Proportion Z-Test
z_score, p_valor_help = proportion.proportions_ztest(np.array(tabela_help_interact['sucesso']), 
                                                     np.array(tabela_help_interact['observacoes']),
                                                     alternative='smaller') 

print('P-Valor: {}.'.format(p_valor_help))
if p_valor < 0.05:
    print('Rejeitamos a hipótese nula. Ou seja, concluímos que o botão help é melhor que o botão interact')
else:
    print('Falhamos em rejeitar a hipótese nula. Isto é, concluímos que não há diferença entre as taxas de cliques dos botões.')

P-Valor: 0.0010403625926695664.
Rejeitamos a hipótese nula. Ou seja, concluímos que o botão help é melhor que o botão interact


## Botões Services e Interact

In [60]:
# Aplicação do Two Proportion Z-Test
z_score, p_valor_services = proportion.proportions_ztest(np.array(tabela_services_interact['sucesso']), 
                                                         np.array(tabela_services_interact['observacoes']),
                                                         alternative='smaller') 

print('P-Valor: {}.'.format(p_valor_services))
if p_valor < 0.05:
    print('Rejeitamos a hipótese nula. Ou seja, concluímos que o botão services é melhor que o botão interact')
else:
    print('Falhamos em rejeitar a hipótese nula. Isto é, concluímos que não há diferença entre as taxas de cliques dos botões.')

P-Valor: 4.611198379025424e-08.
Rejeitamos a hipótese nula. Ou seja, concluímos que o botão services é melhor que o botão interact


# 5.0 - Respondendo as Perguntas de Negócio

**1. Alguma das conversões é realmente melhor do que a atual? Qual seria o nome da variação?**

Concluímos que os botões "Services", "Connect" e "Help" são melhores que o botão "Interact". Entretanto, quanto menor o p-valor, melhor é a efetividade do botão. Assim, como o menor p-valor é o do botão "Connect", nós concluímos que a melhor sugestão de botão, segundo os teste, é o botão "Connect". 