<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#AB-Testing" data-toc-modified-id="AB-Testing-1"><span class="toc-item-num">1&nbsp;&nbsp;</span>AB-Testing</a></span></li></ul></div>

# AB-Testing

![cats](images/cats.jpeg)


Imaginad que somos los cientificos de datos de la empresa de videojuegos Tactile Entertainment. Los desarrolladores del juego Cookie Cats pretenden introducir un cambio en el juego para aumentar la retencion de los jugadores. En cierto nivel del juego los jugadores se encuentran una puerta que les obliga a esperar o a pagar la app. Actualmente la puerta se encuentra en nivel 30 y se pretende pasar al nivel 40, para comprobar la retencion a 1 y 7 dias. Antes de realizar el cambio definitivo en el juego se raliza un test AB.

Los datos estan alojados en `data/cookie_cats.csv`. Nuestro grupo de control sera la version actual `gate_30` y el grupo de tratamiento sera la version `gate_40`. Debemos realizar el test para 1 dia de retencion `retention_1` y para 7 dias `retention_7`.

In [2]:
# librerias

import pandas as pd
import numpy as np

from statsmodels.stats.proportion import proportions_ztest, proportion_confint
from scipy.stats import norm, sem

import pylab as plt

In [3]:
# datos
tactile = pd.read_csv('data/cookie_cats.csv')

In [4]:
# transformacion

tactile.head()

Unnamed: 0,userid,version,sum_gamerounds,retention_1,retention_7
0,116,gate_30,3,False,False
1,337,gate_30,38,True,False
2,377,gate_40,165,True,False
3,483,gate_40,1,False,False
4,488,gate_40,179,True,True


In [5]:
tactile.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 90189 entries, 0 to 90188
Data columns (total 5 columns):
 #   Column          Non-Null Count  Dtype 
---  ------          --------------  ----- 
 0   userid          90189 non-null  int64 
 1   version         90189 non-null  object
 2   sum_gamerounds  90189 non-null  int64 
 3   retention_1     90189 non-null  bool  
 4   retention_7     90189 non-null  bool  
dtypes: bool(2), int64(2), object(1)
memory usage: 2.2+ MB


In [9]:
pd.crosstab(tactile['version'], tactile['retention_1'])

retention_1,False,True
version,Unnamed: 1_level_1,Unnamed: 2_level_1
gate_30,24666,20034
gate_40,25370,20119


In [10]:
pd.crosstab(tactile['version'], tactile['retention_7'])

retention_7,False,True
version,Unnamed: 1_level_1,Unnamed: 2_level_1
gate_30,36198,8502
gate_40,37210,8279


In [12]:
# muestreo
len(tactile[tactile['version'] == 'gate_30']), len(tactile[tactile['version'] == 'gate_40'])

(44700, 45489)

In [18]:
# testeo para retention_1
gate_30 = tactile[tactile['version'] == 'gate_30']

gate_40 = tactile[tactile['version'] == 'gate_40']

ab_test=pd.concat([gate_30, gate_40], axis=0)

ab_test.reset_index(drop=True, inplace=True)

ab_test.head()

Unnamed: 0,userid,version,sum_gamerounds,retention_1,retention_7
0,116,gate_30,3,False,False
1,337,gate_30,38,True,False
2,1066,gate_30,0,False,False
3,2101,gate_30,0,False,False
4,2179,gate_30,39,True,False


In [19]:
gate_30_1 = ab_test[ab_test['version'] == 'gate_30']['retention_1']
gate_40_1 = ab_test[ab_test['version'] == 'gate_40']['retention_1']

In [25]:
observaciones = [44700, 45489]

conversiones = [gate_30_1.sum(), gate_40_1.sum()] 

z_score, p_valor = proportions_ztest(conversiones, nobs=observaciones)

(gate_30_a, gate_40_a), (gate_30_b, gate_40_b) = proportion_confint(conversiones, 
                                                                
                                                                nobs=observaciones,
                                                                
                                                                alpha=0.05)

In [26]:
print(f'z-score: {z_score:.2f}')

print(f'p-valor: {p_valor:.3f}')

print(f'intervalo conf 95% para grupo control: [{gate_30_a:.3f}, {gate_30_b:.3f}]')

print(f'intervalo conf 95% para grupo tratamiento: [{gate_40_a:.3f}, {gate_40_b:.3f}]')

z-score: 1.78
p-valor: 0.074
intervalo conf 95% para grupo control: [0.444, 0.453]
intervalo conf 95% para grupo tratamiento: [0.438, 0.447]


In [27]:
# testeo para retention_7
gate_30_7 = ab_test[ab_test['version'] == 'gate_30']['retention_7']
gate_40_7 = ab_test[ab_test['version'] == 'gate_40']['retention_7']

In [28]:
conversiones = [gate_30_7.sum(), gate_40_7.sum()] 

z_score, p_valor = proportions_ztest(conversiones, nobs=observaciones)

(gate_30_a, gate_40_a), (gate_30_b, gate_40_b) = proportion_confint(conversiones, 
                                                                
                                                                nobs=observaciones,
                                                                
                                                                alpha=0.05)

In [29]:
print(f'z-score: {z_score:.2f}')

print(f'p-valor: {p_valor:.3f}')

print(f'intervalo conf 95% para grupo control: [{gate_30_a:.3f}, {gate_30_b:.3f}]')

print(f'intervalo conf 95% para grupo tratamiento: [{gate_40_a:.3f}, {gate_40_b:.3f}]')

z-score: 3.16
p-valor: 0.002
intervalo conf 95% para grupo control: [0.187, 0.194]
intervalo conf 95% para grupo tratamiento: [0.178, 0.186]


# conclusiones
# Explica detalladamente las conclusiones obtenidas de. tu testeo.

En Ret_1 no podemos rechazar h0, por lo que la gate_40 no implicaría que los jugadores se queden, en cambio, la Ret_7 podemos rechazarla y habría una probabilidad con una confianza del 95% que se queden.