# Análise de Resultados e Tomada de Decisão

## Estatística t

A estatística t é uma medida padronizada que avalia a diferença entre a média das amostras em relação à variabilidade das amostras. Ela indica quantos erros padrão a diferença observada entre as médias está afastada da diferença esperada sob a hipótese nula.Quanto maior o valor absoluto da estatística t, maior é a diferença entre as médias das amostras em relação à variabilidade dos dados. Um valor absoluto elevado (longe de 0) sugere que é menos provável que a diferença observada seja devida ao acaso.

# Análise Final dos Resultados do Teste A/B

## Recapitulação do Propósito e das Metas do Teste

O propósito deste teste A/B foi avaliar o desempenho das variáveis e ajustes implementados nas diferentes versões das páginas, com o objetivo de identificar a variante que apresenta a melhor taxa de conversão de leads.

### Hipóteses Iniciais
1. **Facilidade na escrita:** As mudanças na interface do usuário facilitando a escrita, e melhora o entendimento aumentando a taxa de conversão.
2. **Botão do WhatsApp:** O botão do WhatsApp atrapalha o preenchimento do formulário, e sua remoção melhorará a taxa de conversão.

### Estrutura do Teste

O teste foi configurado com várias versões de páginas (Grupos 1 a 5) e uma versão oficial de controle (Página A). A análise comparou a performance de cada grupo com a versão oficial, bem como entre os próprios grupos.


### Apresentação Completa dos Dados Acumulados

| Grupo   | Forms | Sessões na Página | Taxa de Conversão |
|---------|-------|-------------------|-------------------|
| Página A| 470   | 13,476            | 3.5%              |
| Grupo 1 | 45    | 888               | 5.1%              |
| Grupo 2 | 30    | 600               | 5.0%              |
| Grupo 3 | 32    | 867               | 3.7%              |
| Grupo 4 | 31    | 611               | 5.1%              |
| Grupo 5 | 17    | 534               | 3.2%              |

### Descrição das Ferramentas e Técnicas Estatísticas Utilizadas
Para a análise dos dados, foram utilizadas técnicas estatísticas para calcular a estatística t, o valor p e o Cohen's d.

# Estatística t
A estatística t é uma medida padronizada que avalia a diferença entre a média das amostras em relação à variabilidade das amostras. Ela indica quantos erros padrão a diferença observada entre as médias está afastada da diferença esperada sob a hipótese nula. Quanto maior o valor absoluto da estatística t, maior é a diferença entre as médias das amostras em relação à variabilidade dos dados. Um valor absoluto elevado (longe de 0) sugere que é menos provável que a diferença observada seja devida ao acaso.

### Como interpretar a estatística t?
**Próxima de zero**: A diferença observada está próxima da diferença esperada sob a hipótese nula, sugerindo que não há uma diferença significativa.

**Alta (e positiva)**: Indica que a média do grupo experimental é maior que a do grupo controle.

**Negativa**: Indica que a média do grupo experimental é menor que a do grupo controle.

## Cálculo da Estatística t e Valor p

In [27]:
import numpy as np
from scipy import stats

def stats_t_prop(n1, x1, n2, x2):
    # Proporções
    p1 = x1 / n1
    p2 = x2 / n2

    # Proporção combinada
    p_combined = (x1 + x2) / (n1 + n2)

    # Cálculo do denominador
    denominator = np.sqrt(p_combined * (1 - p_combined) * (1/n1 + 1/n2))

    # Estatística t
    t_stat = (p1 - p2) / denominator

    # Graus de liberdade (aproximado)
    df = min(n1, n2) - 1

    # P-valor para a estatística t calculada
    p_value = 2 * (1 - stats.t.cdf(np.abs(t_stat), df))
    return t_stat, p_value

# Dados
dados_pagina_a = (13476, 470)  # Página A: (n, x)
dados_grupos = {
    "Grupo 1": (888, 45),
    "Grupo 2": (600, 30),
    "Grupo 3": (867, 32),
    "Grupo 4": (611, 31),
    "Grupo 5": (534, 17)
}

resultados_t_p = {}
for grupo, (n, x) in dados_grupos.items():
    t_stat, p_value = stats_t_prop(dados_pagina_a[0], dados_pagina_a[1], n, x)
    resultados_t_p[grupo] = (t_stat, p_value)

# Exibição dos resultados
for grupo, (t_stat, p_value) in resultados_t_p.items():
    print(f"{grupo}: Estatística t = {t_stat:.4f}, Valor p = {p_value:.4f}")


Grupo 1: Estatística t = -2.4527, Valor p = 0.0144
Grupo 2: Estatística t = -1.9582, Valor p = 0.0507
Grupo 3: Estatística t = -0.3156, Valor p = 0.7524
Grupo 4: Estatística t = -2.0703, Valor p = 0.0388
Grupo 5: Estatística t = 0.3763, Valor p = 0.7068


##Cohen's d
O Cohen's d é uma medida de tamanho de efeito que expressa a diferença entre duas médias em termos de desvio padrão. Ele é usado para indicar a magnitude da diferença entre duas médias. Um valor absoluto de d em torno de:

<i>0.2 é considerado um efeito pequeno

0.5 é um efeito médio

Acima de 0.8 é um efeito grande</i>

## Cálculo do Cohen's d

In [28]:
import numpy as np

def cohen_d(n1, x1, n2, x2):
    # Proporções
    p1 = x1 / n1
    p2 = x2 / n2

    # Diferença das proporções
    diff = p1 - p2

    # Desvio padrão combinado
    std_combined = np.sqrt(((p1 * (1 - p1)) / n1) + ((p2 * (1 - p2)) / n2))

    # Cohen's d
    d = diff / std_combined
    return d

# Dados da Página A
dados_pagina_a = (13476, 470)  # Página A: (n, x)
dados_grupos = {
    "Grupo 1": (888, 45),
    "Grupo 2": (600, 30),
    "Grupo 3": (867, 32),
    "Grupo 4": (611, 31),
    "Grupo 5": (534, 17)
}

resultados_cohen_d = {}
for grupo, (n, x) in dados_grupos.items():
    d = cohen_d(dados_pagina_a[0], dados_pagina_a[1], n, x)
    resultados_cohen_d[grupo] = d

# Exibição dos resultados
for grupo, d in resultados_cohen_d.items():
    print(f"{grupo}: Cohen's d = {d:.4f}")


Grupo 1: Cohen's d = -2.0986
Grupo 2: Cohen's d = -1.6735
Grupo 3: Cohen's d = -0.3081
Grupo 4: Cohen's d = -1.7587
Grupo 5: Cohen's d = 0.3920


## Exploração de Tendências, Anomalias e Padrões

Durante a análise dos dados, foram observadas as seguintes tendências:

- O Grupo 1 e o Grupo 4 apresentaram a maior taxa de conversão (5.1%).
- O Grupo 2 teve um desempenho próximo ao da Página A (5.0% contra 3.5%).
- O Grupo 5 teve a menor taxa de conversão (3.2%).

## Destaque das Descobertas Principais

Os resultados indicam que os Grupos 1 e 4 tiveram um desempenho significativamente melhor em comparação à Página A, enquanto o Grupo 5 apresentou o pior desempenho. A estatística t e o valor p para a comparação entre o Grupo 2 e a Página A indicam uma diferença marginalmente significativa, com um valor p ligeiramente acima do nível de significância comum de 0.05.

## Apresentação Gráfica dos Resultados

Os gráficos de linhas, barras e dispersão, bem como os infográficos e diagramas de fluxo, enriquecem a apresentação dos dados, destacando tendências, padrões e diferenças entre as variantes testadas.

In [29]:
pip install plotly




In [34]:
import plotly.graph_objects as go

# Dados históricos
dias = ["11 de junho"]
sessao_data = {
    "G1": [460, 460],
    "G2": [303, 303],
    "G3": [443, 443],
    "G4": [309, 309],
    "G5": [278, 278]
}

conversao_data = {
    "G1": [28, 28],
    "G2": [19, 19],
    "G3": [26, 26],
    "G4": [19, 19],
    "G5": [15, 15]
}

def calcular_taxa_conversao(sessoes, conversoes):
    return (conversoes / sessoes) * 100

taxa_conversao_data = {
    grupo: [calcular_taxa_conversao(sessao_data[grupo][i], conversao_data[grupo][i]) for i in range(len(sessao_data[grupo]))]
    for grupo in sessao_data
}

# Gráfico de Sessões (Histograma)
fig_sessoes = go.Figure()

for grupo, sessoes in sessao_data.items():
    fig_sessoes.add_trace(go.Bar(x=dias, y=sessoes, name=grupo))

fig_sessoes.update_layout(
    title="Sessões até 11 de Junho",
    xaxis_title="Data",
    yaxis_title="Número de Sessões",
    legend_title="Grupos",
    barmode='group',
    template="plotly_white"
)

# Gráfico de Conversões (Histograma)
fig_conversoes = go.Figure()

for grupo, conversoes in conversao_data.items():
    fig_conversoes.add_trace(go.Bar(x=dias, y=conversoes, name=grupo))

fig_conversoes.update_layout(
    title="Conversões até 11 de Junho",
    xaxis_title="Data",
    yaxis_title="Número de Conversões",
    legend_title="Grupos",
    barmode='group',
    template="plotly_white"
)

# Gráfico de Taxa de Conversão (Histograma)
fig_taxa_conversao = go.Figure()

for grupo, taxa_conversao in taxa_conversao_data.items():
    fig_taxa_conversao.add_trace(go.Bar(x=dias, y=taxa_conversao, name=grupo))

fig_taxa_conversao.update_layout(
    title="Taxa de Conversão até 11 de Junho",
    xaxis_title="Data",
    yaxis_title="Taxa de Conversão (%)",
    legend_title="Grupos",
    barmode='group',
    template="plotly_white"
)

# Mostrar gráficos
fig_sessoes.show()
fig_conversoes.show()
fig_taxa_conversao.show()


In [35]:
import plotly.graph_objects as go

# Dados
labels = ['Página A', 'Grupo 1', 'Grupo 2', 'Grupo 3', 'Grupo 4', 'Grupo 5']
forms = [470, 45, 30, 32, 31, 17]
sessions = [13476, 888, 600, 867, 611, 534]
conversion_rates = [3.5, 5.1, 5.0, 3.7, 5.1, 3.2]

# Gráfico de barras - Taxa de Conversão
fig = go.Figure()

fig.add_trace(go.Bar(
    x=labels,
    y=conversion_rates,
    name='Taxa de Conversão (%)',
    marker_color='indigo'
))

fig.update_layout(
    title='Taxa de Conversão por Grupo no Final do Teste',
    xaxis_title='Grupo',
    yaxis_title='Taxa de Conversão (%)',
    barmode='group'
)

# Gráfico de barras - Forms e Sessões
fig2 = go.Figure()

fig2.add_trace(go.Bar(
    x=labels,
    y=forms,
    name='Forms',
    marker_color='green'
))

fig2.add_trace(go.Bar(
    x=labels,
    y=sessions,
    name='Sessões na Página',
    marker_color='orange'
))

fig2.update_layout(
    title='Forms e Sessões por Grupo no Final do Teste',
    xaxis_title='Grupo',
    yaxis_title='Quantidade',
    barmode='group'
)

# Mostrar gráficos
fig.show()
fig2.show()


# Conclusão

Com base na análise dos dados e nas conclusões acima, recomendamos que as modificações implementadas nos Grupos 1 e 4 sejam consideradas para uma possível implementação mais ampla, dado seu impacto positivo nas taxas de conversão.

Além disso, as mudanças nos Grupos 2 e 3 também mostraram resultados promissores e merecem atenção. Embora esses grupos não tenham se destacado tanto quanto os Grupos 1 e 4, eles apresentaram taxas de conversão competitivas que justificam uma análise mais detalhada para entender melhor os fatores de sucesso envolvidos.

Por outro lado, as modificações feitas no Grupo 5 devem ser observadas com cuidado devido ao seu desempenho inferior em termos de conversão. É essencial não descartar imediatamente essas alterações, mas sim revisar e ajustar conforme necessário. Precisamos de dados complementares, como métricas de scroll nas telas e outras interações do usuário, para determinar quais mudanças específicas podem ter influenciado negativamente a conversão.

Recomendamos também aumentar o tempo do teste e coletar mais dados para obter uma visão mais robusta e confiável. Isso permitirá uma avaliação mais precisa da eficácia das modificações e garantirá que as decisões sejam baseadas em uma quantidade adequada de informações.

Finalmente, uma análise adicional para identificar os fatores específicos que contribuíram para os desempenhos observados é fundamental. Testar novas modificações, combinadas com as estratégias de sucesso identificadas, ajudará a continuar otimizando a interface e a experiência do usuário.