# Relatório de Teste A/B – Avaliação de Novo Fluxo de Interface


<h3>1. Objetivo do Teste</h3>
<br>
O objetivo deste teste A/B foi avaliar se a introdução de novos fluxos na interface do mobile
— especificamente na tarefa de mudança de foto de perfil e relatórios — traria uma melhoria de
desempenho medida em tempo médio de conclusão da tarefa (em segundos). O Teste A
representa o fluxo original, enquanto o Teste B representa a nova versão, que inclui um
passo adicional para aprimorar a experiência e a clareza do processo.

<h3>2. Detalhamento da Coleta de Dados</h3>
<br>
A coleta de dados foi realizada por meio da plataforma Maze, ferramenta de testes de
usabilidade amplamente utilizada. Durante os experimentos, 30 usuários participaram de
cada versão (A e B), totalizando 60 observações para cada fluxo. Cada participante executou a mesma
tarefa em condições controladas, e o tempo de execução (em segundos) foi registrado
automaticamente pelo Maze. O teste foi conduzido no mesmo contexto de uso, garantindo
que as diferenças de tempo refletissem apenas variações no fluxo e não em fatores
externos.


In [43]:
import math
import numpy as np
from scipy import stats

## Primeiro Fluxo | Mudar foto perfil:


In [44]:
# TESTE A  Mudar foto perfil:
teste_a = [
    4.51, 3.31, 4.69, 5.3, 2.87, 60.0, 6.05, 5.18, 3.9, 3.08, 13.0, 5.8,
    7.77, 2.42, 13.72, 3.59, 8.76, 13.33, 12.02, 14.28, 2.32, 1.85, 2.3,
    3.75, 5.47, 7.49, 3.15, 5.55, 3.77, 3.43
]

# TESTE B  Mudar foto perfil:
teste_b = [
    6.14, 27.65, 11.19, 14.21, 15.38, 18.57, 16.62, 20.62, 14.13, 12.91,
    12.31, 38.86, 4.17, 14.63, 8.0, 12.23, 12.37, 8.04, 9.31, 11.71, 8.06,
    21.21, 10.15, 11.93, 13.52, 13.42, 4.57, 17.08, 15.43, 9.14
    ]

In [45]:
# numero de elementos
n_a = teste_a.__len__()
# media de A
c = 0
for i in teste_a:
    c += i
media_a = c/n_a

# numero de elementos
n_b = teste_b.__len__()
# media de B
c = 0
for i in teste_b:
    c += i
media_b = c/n_b

In [46]:
print("""
Tamanho A: {n_a}
Tamanho B: {n_b}

Médias:      
Média A: {media_a}
Média B: {media_b}
""".format(n_a=n_a, n_b=n_b, media_a=media_a, media_b=media_b))



Tamanho A: 30
Tamanho B: 30

Médias:      
Média A: 7.755333333333335
Média B: 13.78533333333333



#### devios A e B


In [47]:
# desvio Ad
c = 0
for i in teste_a:
    c += (i - media_a)**2

desvio_a = math.sqrt(c/n_a)

print("Desvio padrão A: {:.2f}".format(desvio_a))


# desvio B
c = 0
for i in teste_b:
    c += (i - media_b)**2

desvio_b = math.sqrt(c/n_b)

print("Desvio padrão B: {:.2f}".format(desvio_b))

Desvio padrão A: 10.37
Desvio padrão B: 6.79


### Em questão de tempo, o melhor teste seria o mais rápido

In [48]:
a = np.array(teste_a)
b = np.array(teste_b)


t_stat, p_valor_bilateral = stats.ttest_ind(a, b, equal_var=False)
p_valor_unilateral = p_valor_bilateral / 2 if t_stat > 0 else 1 - (p_valor_bilateral / 2)

significancia = 0.05
rejeita = p_valor_unilateral < significancia

In [49]:
print(f"""
===== TESTE A/B # Mudar foto perfil - COMPARAÇÃO DE MÉDIAS =====

Hipóteses:
  H0: μA <= μB
  H1: μA  >  μB

Tamanho A: {n_a}
Tamanho B: {n_b}

MÉDIAS:
  Média A = {media_a:.2f}s
  Média B = {media_b:.2f}s

DESVIOS PADRÃO:
  Desvio A = {desvio_a:.2f}
  Desvio B = {desvio_b:.2f}

ESTATÍSTICA:
  t = {t_stat:.4f}
  p-valor (unilateral) = {p_valor_unilateral:.6f}
  α = {significancia:.2f}

Conclusão:
  {" Rejeita H0 — A é estatisticamente MAIOR que B" if rejeita else " Não rejeita H0 — não há evidência de que A > B"}
""")


===== TESTE A/B # Mudar foto perfil - COMPARAÇÃO DE MÉDIAS =====

Hipóteses:
  H0: μA <= μB
  H1: μA  >  μB

Tamanho A: 30
Tamanho B: 30

MÉDIAS:
  Média A = 7.76s
  Média B = 13.79s

DESVIOS PADRÃO:
  Desvio A = 10.37
  Desvio B = 6.79

ESTATÍSTICA:
  t = -2.6196
  p-valor (unilateral) = 0.994187
  α = 0.05

Conclusão:
   Não rejeita H0 — não há evidência de que A > B



## Segundo Fluxo |  Relatório:


In [50]:
# TESTE A  Relatório:
teste_a = [
    7.72, 17.82, 14.26, 25.5, 9.14, 5.22, 19.03, 15.03, 9.46, 5.69,
    15.1, 14.0, 16.65, 67.86, 11.73, 8.51, 12.02, 15.38, 8.71, 50.69,
    2.95, 3.81, 4.88, 24.58, 8.2, 59.13, 7.54, 6.0, 8.37, 9.18
]

# TESTE B Relatório:
teste_b = [
    5.21, 5.04, 11.73, 14.8, 11.98, 11.58, 7.05, 44.16, 45.31, 10.19,
    15.2, 17.43, 23.74, 36.43, 13.0, 16.18, 15.02, 16.2, 21.72, 11.73,
    19.35, 9.76, 9.26, 32.26, 10.67, 8.48, 12.69, 10.07, 8.48, 12.69,
    10.07, 14.51, 15.27, 18.74, 19.5, 10.57
]


In [51]:
# numero de elementos
n_a = teste_a.__len__()
# media de A
c = 0
for i in teste_a:
    c += i
media_a = c/n_a

# numero de elementos
n_b = teste_b.__len__()
# media de B
c = 0
for i in teste_b:
    c += i
media_b = c/n_b

In [52]:
print("""
Tamanho A: {n_a}
Tamanho B: {n_b}

Médias:      
Média A: {media_a}
Média B: {media_b}
""".format(n_a=n_a, n_b=n_b, media_a=media_a, media_b=media_b))



Tamanho A: 30
Tamanho B: 36

Médias:      
Média A: 16.138666666666666
Média B: 16.001944444444447



#### devios A e B


In [53]:
# desvio Ad
c = 0
for i in teste_a:
    c += (i - media_a)**2

desvio_a = math.sqrt(c/n_a)

print("Desvio padrão A: {:.2f}".format(desvio_a))


# desvio B
c = 0
for i in teste_b:
    c += (i - media_b)**2

desvio_b = math.sqrt(c/n_b)

print("Desvio padrão B: {:.2f}".format(desvio_b))

Desvio padrão A: 15.54
Desvio padrão B: 9.49


### Em questão de tempo, o melhor teste seria o mais rápido

In [54]:
a = np.array(teste_a)
b = np.array(teste_b)


t_stat, p_valor_bilateral = stats.ttest_ind(a, b, equal_var=False)
p_valor_unilateral = p_valor_bilateral / 2 if t_stat > 0 else 1 - (p_valor_bilateral / 2)

significancia = 0.05
rejeita = p_valor_unilateral < significancia

In [55]:
print(f"""
===== TESTE A/B # Mudar foto perfil - COMPARAÇÃO DE MÉDIAS =====

Hipóteses:
  H0: μA <= μB
  H1: μA  >  μB

Tamanho A: {n_a}
Tamanho B: {n_b}

MÉDIAS:
  Média A = {media_a:.2f}s
  Média B = {media_b:.2f}s

DESVIOS PADRÃO:
  Desvio A = {desvio_a:.2f}
  Desvio B = {desvio_b:.2f}

ESTATÍSTICA:
  t = {t_stat:.4f}
  p-valor (unilateral) = {p_valor_unilateral:.6f}
  α = {significancia:.2f}

Conclusão:
  {" Rejeita H0 — A é estatisticamente MAIOR que B" if rejeita else " Não rejeita H0 — não há evidência de que A > B"}
""")


===== TESTE A/B # Mudar foto perfil - COMPARAÇÃO DE MÉDIAS =====

Hipóteses:
  H0: μA <= μB
  H1: μA  >  μB

Tamanho A: 30
Tamanho B: 36

MÉDIAS:
  Média A = 16.14s
  Média B = 16.00s

DESVIOS PADRÃO:
  Desvio A = 15.54
  Desvio B = 9.49

ESTATÍSTICA:
  t = 0.0414
  p-valor (unilateral) = 0.483573
  α = 0.05

Conclusão:
   Não rejeita H0 — não há evidência de que A > B

