# Notebook de testing

In [39]:
# Librerías

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import sys
from pathlib import Path
from scipy.stats import ttest_ind, chi2_contingency
from statsmodels.stats.proportion import proportions_ztest

# sube de notebooks/ a la raíz del repo

sys.path.append(str(Path.cwd().parent))

import src.functions as fc

%matplotlib inline 
%load_ext autoreload
%autoreload 2

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


In [40]:
df1 = pd.read_csv("https://raw.githubusercontent.com/data-bootcamp-v4/lessons/refs/heads/main/5_6_eda_inf_stats_tableau/project/files_for_project/df_final_demo.txt")
df2 = fc.load_data_merge("20260212_1519_df2_merged.csv")
df3 = pd.read_csv("https://raw.githubusercontent.com/data-bootcamp-v4/lessons/refs/heads/main/5_6_eda_inf_stats_tableau/project/files_for_project/df_final_experiment_clients.txt")

In [41]:
df2.head()

Unnamed: 0,client_id,visitor_id,visit_id,process_step,date_time
0,9988021,580560515_7732621733,781255054_21935453173_531117,step_3,2017-04-17 15:27:07
1,9988021,580560515_7732621733,781255054_21935453173_531117,step_2,2017-04-17 15:26:51
2,9988021,580560515_7732621733,781255054_21935453173_531117,step_3,2017-04-17 15:19:22
3,9988021,580560515_7732621733,781255054_21935453173_531117,step_2,2017-04-17 15:19:13
4,9988021,580560515_7732621733,781255054_21935453173_531117,step_3,2017-04-17 15:18:04


In [42]:
# Drop

df3 = df3.dropna()

## Tasa de finalización por grupo

In [43]:
# Filtro por grupo

test = df3[df3["Variation"]=="Test"]
control = df3[df3["Variation"]=="Control"]

control

Unnamed: 0,client_id,Variation
2,4033851,Control
4,9294070,Control
7,6651403,Control
9,2105948,Control
12,9814849,Control
...,...,...
50491,4364429,Control
50493,8730282,Control
50494,5305116,Control
50495,393005,Control


In [44]:
# Filtramos grupo de control

df_control = df2[df2["client_id"].isin(control["client_id"])]
df_test = df2[df2["client_id"].isin(test["client_id"])]

# Tasa de finalizacion por grupo

tasa_finalizacion_control = fc.tasa_finalizacion(df_control)
tasa_finalizacion_test = fc.tasa_finalizacion(df_test)

tasa_finalizacion_control, tasa_finalizacion_test

(65.59, 69.29)

## TEST 1

In [45]:
# H0 -> tasa de finalización Test = control
# H1 -> tasa de finalización Test != control

finish_control = fc.finish(df_control)

finish_test = fc.finish(df_test)

_, p_value = ttest_ind(finish_control, finish_test, equal_var=False)

p_value

np.float64(8.009768670783661e-19)

- Rechazamos la hipótesis nula y aceptamos la hipótesis alternativa con un nivel de significancia del 5%

In [46]:
# tasa de crecimiento relativo = nuevo - antiguo / antiguo

tasa_crecimiento_relativo = (tasa_finalizacion_test - tasa_finalizacion_control) / tasa_finalizacion_control * 100

tasa_crecimiento_relativo

5.64110382680287

- Sí se puede aplicar dado que ha crecido más de un 5%. Ha superado el umbral marcado por la empresa: es rentable.

## TEST 2. Testing por usuario hasta confirm (control vs test)

In [47]:
# Constantes e hipótesis

ALPHA = 0.05
CONFIRM_STEP = "confirm"
ALT = "less"

# H0: test no es más rapido (igual o peor)
# H1: test es más rápido

In [48]:
# 1) Preparar datos de eventos (tipos y orden)

df_events = df2.copy()

df_events = fc.to_datetime(df_events)

control_times, test_times = fc.calcular_tiempo_para_test(df_events, df3)


In [None]:
# 2) TEST

_, p_value = ttest_ind(test_times, control_times, alternative="less", equal_var=False)

p_value

# Hay evidencia estadística a favor de H1. Se rechaza hipótesis
# nula y se acepta alternativa. 

np.float64(1.324369909605251e-05)

## TEST 3. Por edad promedio (Test vs Control)

In [None]:
#H0 -> edad promedio Test = edad promedio Control 

#H1 -> edad promedio Test != edad promedio Control 

In [None]:
test_edad, control_edad, df_final = fc.preparar_grupos_experimento(df1, df3, "clnt_age")

_, p_value_age = ttest_ind(test_edad.dropna(), control_edad.dropna(), equal_var=False)

print(p_value_age)


Rechazamos la hipótesis nula y aceptamos la hipótesis alternativa con un nivel de significancia del 5%.

In [None]:
sns.histplot(data=df_final, x="clnt_age", hue="Variation", kde=True, element="step")
plt.title(f"Distribución de Edad (p-valor: {p_value_age:.4f})")
plt.show()

Comprobamos que las curvas de ambos grupos siguen la misma forma. Pero destacamos que el grupo Test tiene más usuarios encuestados que el grupo Control.

## TEST 4. Por permanencia promedio (Test vs Control)

In [None]:
#H0 -> permanencia promedio Test = permanencia promedio Control

#H1 -> permanencia promedio Test != permanencia promedio Control

In [None]:
test_permanencia, control_permanencia, df_final = fc.preparar_grupos_experimento(df1, df3, "clnt_tenure_yr")

In [None]:
_, p_value_permanencia = ttest_ind(test_permanencia.dropna(), control_permanencia.dropna(), equal_var=False)

print(p_value_permanencia)

No podemos rechazar la hipótesis nula, por lo que no hay evidencia de una diferencia en la permanencia.

In [None]:
sns.boxplot(data=df_final, x="Variation", y="clnt_tenure_yr", palette="Set2")
plt.title("Comparación de Permanencia en Años")
plt.show()

Aunque el grupo Control tiene una mediana de permanencia ligeramente superior, no hay una diferencia significativa. Esto demuestra que los grupos están equilibrados y que la permanencia del usuario no sesgará los resultados del experimento.