<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#AB-Testing" data-toc-modified-id="AB-Testing-1"><span class="toc-item-num">1&nbsp;&nbsp;</span>AB-Testing</a></span></li></ul></div>

# AB-Testing

![cats](images/cats.jpeg)


Imaginad que somos los cientificos de datos de la empresa de videojuegos Tactile Entertainment. Los desarrolladores del juego Cookie Cats pretenden introducir un cambio en el juego para aumentar la retencion de los jugadores. En cierto nivel del juego los jugadores se encuentran una puerta que les obliga a esperar o a pagar la app. Actualmente la puerta se encuentra en nivel 30 y se pretende pasar al nivel 40, para comprobar la retencion a 1 y 7 dias. Antes de realizar el cambio definitivo en el juego se raliza un test AB.

Los datos estan alojados en `data/cookie_cats.csv`. Nuestro grupo de control sera la version actual `gate_30` y el grupo de tratamiento sera la version `gate_40`. Debemos realizar el test para 1 dia de retencion `retention_1` y para 7 dias `retention_7`.

In [92]:
# librerias

import pandas as pd
import numpy as np

from statsmodels.stats.proportion import proportions_ztest, proportion_confint
from scipy.stats import norm, sem

import pylab as plt
from scipy.stats import bernoulli, beta   

In [4]:
# datos
data= pd.read_csv('data/cookie_cats.csv')
data.head()

Unnamed: 0,userid,version,sum_gamerounds,retention_1,retention_7
0,116,gate_30,3,False,False
1,337,gate_30,38,True,False
2,377,gate_40,165,True,False
3,483,gate_40,1,False,False
4,488,gate_40,179,True,True


In [5]:
# transformacion
data.version.unique()


array(['gate_30', 'gate_40'], dtype=object)

In [8]:
data.userid.nunique()

90189

In [10]:
data.shape

(90189, 5)

In [18]:
data.sum_gamerounds.describe()

count    90189.000000
mean        51.872457
std        195.050858
min          0.000000
25%          5.000000
50%         16.000000
75%         51.000000
max      49854.000000
Name: sum_gamerounds, dtype: float64

In [33]:
gate_30 = data[(data['version']=='gate_30')& (data['sum_gamerounds'] > 5) ]
gate_40 = data[(data['version']=='gate_40')& (data['sum_gamerounds'] > 5) ]
gate_40

Unnamed: 0,userid,version,sum_gamerounds,retention_1,retention_7
2,377,gate_40,165,True,False
4,488,gate_40,179,True,True
5,540,gate_40,187,True,True
8,1574,gate_40,108,True,True
9,1587,gate_40,153,True,False
...,...,...,...,...,...
90181,9998733,gate_40,10,True,False
90184,9999441,gate_40,97,True,False
90185,9999479,gate_40,30,False,False
90187,9999768,gate_40,51,True,False


In [36]:
gate_30_1 = pd.crosstab(gate_30.version, gate_30.retention_1)

In [37]:
gate_30_7 = pd.crosstab(gate_30.version, gate_30.retention_7)

In [38]:
gate_40_1 = pd.crosstab(gate_40.version, gate_40.retention_1)

In [39]:
gate_40_7 = pd.crosstab(gate_40.version, gate_40.retention_7)

In [42]:
retention_1 = pd.concat([gate_30_1,gate_40_1], axis = 0)
retention_1

retention_1,False,True
version,Unnamed: 1_level_1,Unnamed: 2_level_1
gate_30,13391,19253
gate_40,13614,19214


In [43]:
retention_7 = pd.concat([gate_30_7,gate_40_7], axis = 0)
retention_7

retention_7,False,True
version,Unnamed: 1_level_1,Unnamed: 2_level_1
gate_30,24289,8355
gate_40,24715,8113


In [58]:
# muestreo

retention_1[True][0],retention_1[True][1]

(19253, 19214)

In [62]:
retention_1[True][0]+ retention_1[False][0], retention_1[True][1]+ retention_1[False][1]

(32644, 32828)

In [82]:
# testeo para retention_1
impresiones1=[32644, 32828] 
    
conversiones1=[retention_1[True][0], retention_1[True][1]]


z_score, p_value = proportions_ztest(conversiones, nobs=impresiones)

(gate_30_a, gate_40_a), (gate_30_b, gate_40_b) = proportion_confint(conversiones, 
                                                                nobs=impresiones,
                                                                alpha=0.05)

print(f'z-score: {z_score:.2f}')

print(f'p-valor: {p_value:.3f}')

print(f'intervalo conf 95% para gate_30: [{gate_30_a:.3f}, {gate_30_b:.3f}]')

print(f'intervalo conf 95% para gate_40: [{gate_40_a:.3f}, {gate_40_b:.3f}]')

z-score: 2.32
p-valor: 0.020
intervalo conf 95% para gate_30: [0.378, 0.391]
intervalo conf 95% para gate_40: [0.367, 0.380]


In [71]:
retention_7[True][0],retention_7[True][1]

(8355, 8113)

In [73]:
retention_7[True][0]+ retention_1[False][0], retention_7[True][1]+ retention_1[False][1]

(21746, 21727)

In [81]:
# testeo para retention_7

impresiones7=[21746, 21727] 
    
conversiones7=[retention_7[True][0], retention_7[True][1]]


z_score, p_value = proportions_ztest(conversiones, nobs=impresiones)

(gate_30_7_a, gate_40_7_a), (gate_30_7_b, gate_40_7_b) = proportion_confint(conversiones, 
                                                                nobs=impresiones,
                                                                alpha=0.05)

print(f'z-score: {z_score:.2f}')

print(f'p-valor: {p_value:.3f}')

print(f'intervalo conf 95% para gate_30_7: [{gate_30_7_a:.3f}, {gate_30_7_b:.3f}]')

print(f'intervalo conf 95% para gate_40_7: [{gate_40_a:.3f}, {gate_40_7_b:.3f}]')

z-score: 2.32
p-valor: 0.020
intervalo conf 95% para gate_30_7: [0.378, 0.391]
intervalo conf 95% para gate_40_7: [0.367, 0.380]


In [None]:
# conclusiones
'''En gate_30 no podemos rechazar h0 con un 95% de confianza
En gate_40 podemos rechazar H0 con un nivel de confianza del 95%'''
# Explica detalladamente las conclusiones obtenidas de. tu testeo.

In [90]:
convs_30_1= conversiones1[0]
impres_30_1 = impresiones1[0]
convs_40_7= conversiones7[1]
impres_40_7 = impresiones7[1]
convs_30_7= conversiones7[0]
impres_30_7 = impresiones7[0]
convs_40_1= conversiones1[1]
impres_40_1 = impresiones1[1]

In [100]:

a_C, b_C = 1+convs_30_1, 1+impres_30_1-convs_30_1

a_T, b_T = 1+convs_30_7, 1+impres_30_7-convs_30_7

beta_gate_30 = beta(a_C, b_C)

beta_gate_40 = beta(a_T, b_T)

In [101]:
beta_gate_30.mean(), beta_gate_40.mean()

(0.5897812902040066, 0.3842192385506713)

In [104]:
a_C, b_C = 1+convs_40_1, 1+impres_40_1-convs_40_1

a_T, b_T = 1+convs_40_7, 1+impres_40_7-convs_40_7

beta_gate_30_7 = beta(a_C, b_C)

beta_gate_40_7 = beta(a_T, b_T)

In [105]:
beta_gate_30_7.mean(), beta_gate_40_7.mean()

(0.5852878464818764, 0.373418012793962)