Este Jupyter está basado en los capítulos 2, 3 y 9 del libro Experimetrics, por Peter Moffat

<font size="5">**Importando librerías base**</font>

In [1]:
import pandas as pd
import numpy as np
from scipy.stats import ttest_ind, ranksums, ks_2samp, binom_test, normaltest

# Analizando resultados binarios

Supongamos que a 30 sujetos los hacemos escoger entre dos loterías: una riesgosa y otra segura. 21 escogen la opción riesgosa: y, 9, la segura.

In [2]:
trials = [21, 9] # número de éxitos (escoger opción riesgosa) y fallos

Con estos datos, podemos probar si la muestra es **neutral** al riesgo (p = 0.5), **adversa** al riesgo (p < 0.5) o **propensa** al riesgo (p > 0.5)

In [3]:
binom_test(trials, p=0.5) # prueba de dos colas

0.04277394525706768

In [4]:
binom_test(trials, p=0.5, alternative='greater') # se rechaza la nula en favor de una prob > a 0.5

0.02138697262853384

In [5]:
binom_test(trials, p=0.5, alternative='less') # se rechaza la nula en favor de una prob < a 0.5

0.991937599144876

# Probando normalidad

Creemos una variable con distribución normal y otra chi2

In [6]:
n_obs = 50

In [7]:
var_normal = np.random.normal(size=n_obs) # variable normal
var_chi2 = np.random.chisquare(4,size=n_obs) # variable chi2

Usaremos la prubea de **sesgo y curtosis** para determinar si la distribución de las variables es normal. Su hipótesis nula es que la variable tiene una distribución normal.

In [8]:
normaltest(var_normal)

NormaltestResult(statistic=0.9003290955484142, pvalue=0.637523239960379)

In [9]:
normaltest(var_chi2)

NormaltestResult(statistic=3.760103377379749, pvalue=0.15258221877806502)

Probemos con una variable chi2 que tenga más grados de libertad

In [10]:
var_chi2 = np.random.chisquare(10,size=n_obs) # variable chi2
normaltest(var_chi2)

NormaltestResult(statistic=22.57286568738089, pvalue=1.2541933554578938e-05)

# Treatment testing

Definiendo las variables y parámetros para las pruebas

In [11]:
treatment_effect = 4
treatment = np.array([int(treated >= round(n_obs/2)) for treated in range(0, n_obs)]) # creando un indicador de tratados
outcome = 10 + treatment_effect*treatment + var_normal # definiendo el proceso generador de datos
test_df = pd.DataFrame({"var_normal": var_normal, "treatment": treatment, "outcome": outcome}) # base de datos madre

Separando los datos de nuestros grupos de control y tratamiento

In [12]:
control_group = test_df[test_df["treatment"]==0]
treatment_group = test_df[test_df["treatment"]==1]

## Pruebas paramétricas: Prueba t

La prueba t para muestras independientes es una prueba paramétrica, pues asume que los datos vienen de una población que sigue una distribución de probabilidad específica. En este caso, que nuestro resultado sigue una distribución normal.

In [13]:
ttest_pval = ttest_ind(control_group["outcome"], treatment_group["outcome"]).pvalue
ttest_pval

1.0283308263055054e-16

## Pruebas no paramétricas: Prueba de Mann-Whitney

Las pruebas no paramétricas, como la de Mann-Whitney no requieren supuestos sobre la distribución de los datos

In [14]:
ranksum_pval = ranksums(control_group["outcome"], treatment_group["outcome"]).pvalue
ranksum_pval

2.42580372250851e-09

# Comparando distribuciones: Kolmogorov-Smirnoff

En caso deseemos comparar las distribuciones de la variable de resultados en el grupo de tratamiento y el de resultados, podemos usar el test de Kolmogorov-Smirnoff

In [15]:
ks_pval = ks_2samp(control_group["outcome"], treatment_group["outcome"]).pvalue
ks_pval

1.9381285075999106e-11

# Análisis de poder usando simulaciones de monte carlo

## Generando una base para cada simulación

In [16]:
def base_generator(obs, treatment_effect=4):
    """
    Crea una base de datos con los pvalues para una iteración
    de una simulación de monte carlo
    
    Input: número de observaciones (obs: int), distribucion (funcion de numpy)
    grados de libertad (numero)
    Output: None
    """
       
    #var = np.random.normal(size=obs) # variable normal
    var = np.random.chisquare(4,size=obs) # variable chi2
    
    treatment = np.array([int(treated >= round(obs/2)) for treated in range(0, obs)]) # creando un indicador de tratados
    
    outcome = 10 + treatment_effect*treatment + var # definiendo el proceso generador de datos
  
    df = pd.DataFrame({"var": var, "treatment": treatment, "outcome": outcome}) # base de datos madre
    
    control_group_data = df[df["treatment"]==0]
    treatment_group_data = df[df["treatment"]==1]

    # obteniendo los pvalues de cada test para nuestra base
    ttest_pval = ttest_ind(control_group_data["outcome"], treatment_group_data["outcome"]).pvalue
    ranksum_pval = ranksums(control_group_data["outcome"], treatment_group_data["outcome"]).pvalue
    ks_pval = ks_2samp(control_group_data["outcome"], treatment_group_data["outcome"]).pvalue

    return (ttest_pval, ranksum_pval, ks_pval)
base_generator(20)

(7.501045334606157e-05, 0.001498873337151676, 0.00021650176448938054)

## Realizando las simulaciones 

In [17]:
def simulate_mc(base_grator, obs, reps, sig=0.01, treatment_effect=4):
    """
    Crea una base de datos que indica la significancia al sig% de 
    pruebas estadísticas asociadas a una serie de simulaciones
    de monte carlo
    
    Input: generador de base de datos (función), número de observaciones (int),
    número de repeticiones (int), significancia (float)
    Output: base con las veces que se rechazó la hipótesis nula de cada test (dataframe)
    """
    
    # listas para guardar pvalues de tests
    ttest_pval_list = []
    ranksum_pval_list = []
    ks_pval_list = []
    
    for repetition in range(0, reps):
        (ttest_pval, ranksum_pval, ks_pval) = base_grator(obs, treatment_effect)
        
        # almacenando los valores
        ttest_pval_list.append(ttest_pval)
        ranksum_pval_list.append(ranksum_pval)
        ks_pval_list.append(ks_pval)
    
    # listas para ver si los tests son significativos (1 = signif, 0 = no signif)
    ttest_sig_list = [int(pval <= sig) for pval in ttest_pval_list]
    ranksum_sig_list = [int(pval <= sig) for pval in ranksum_pval_list]
    ks_sig_list = [int(pval <= sig) for pval in ks_pval_list]
    
    return pd.DataFrame({"ttest": ttest_sig_list, "ranksum": ranksum_sig_list, "ks": ks_sig_list})

## Analizando el poder para un set de repeticiones y observaciones

In [18]:
def simulations_vs_sample_size(test):
    """
    Crea una tabla con resultados de un cálculo de poder
    donde las filas son el número de observaciones en cada
    muestra simulada y el número de iteraciones
    
    Input: nombre del test (string: ttest, ranksum, ks)
    Output: tabla con analisis de poder para cada caso (dataframe)
    """
    
    repetitions = [100, 200, 300]
    observations = [20, 200, 2000]

    col_names = [f"T = {reps}" for reps in repetitions]
    row_names = [f"N = {obs}" for obs in observations]

    df_results = pd.DataFrame(columns=col_names, index=row_names)
    
    row_counter = 1
    for obs in observations:
        
        col_counter = 1
        for reps in repetitions:
            power = simulate_mc(base_generator, obs, reps)[test].mean() # cálculando el poder para el caso actual
            df_results.iloc[row_counter-1, col_counter-1] = power
            col_counter += 1

        row_counter += 1
    
    return df_results
simulations_vs_sample_size("ttest")

Unnamed: 0,T = 100,T = 200,T = 300
N = 20,0.63,0.63,0.623333
N = 200,1.0,1.0,1.0
N = 2000,1.0,1.0,1.0
