Dado que tenemos una muestra $X$ y la distribucion esperada de la rueda si esta es justa, podemos utilizar el metodo de Pearson para verificar que la muestra se ajuste a lo esperado. Dado un $T$ estadistico discreto, calcularemos el p-valor para verificar que la muestra efectivamente provenga de la distribucion esperada.

Tomamos $H_0=$ La muestra proviene a la distribucion esperada

Tomamos $H_1=$ La muestra No proviene la distribucion esperada

Vamos a tomar un nivel de confianza del 95% 

In [35]:
from scipy.stats import chi2, binom
import numpy as np

MUESTRA = [ 188,138,87,65,48,32,30,34,13,2 ]
P_H0 = [ x/100 for x in [31,22,12,10,8,6,4,4,2,1]]

def calcular_estadistico(muestra, p_h0):
    n = sum(muestra)
    k = len(muestra)
    t = 0
    for i in range(k):
        t += ((muestra[i] - n*p_h0[i])**2) / (n*p_h0[i])
    return t

def calcular_p_valor(t_est, k, m):
    return  1 - chi2.cdf(t_est, k-1-m)

def simular_p_valor(nsim, muestra, p_h0, t_est):
    total = sum(muestra)
    k = len(muestra)
    p_sim = 0
    for _ in range(nsim):
        acc = np.zeros(k, int)
        for i in range(k):
            p = p_h0[i] / (1 - sum(p_h0[:i]))
            n = total - sum(acc)
            acc[i] = binom.rvs(n, p)
        t_sim = calcular_estadistico(acc, p_h0)
        if t_sim > t_est:
            p_sim += 1/nsim  
    return p_sim

In [36]:
T_EST = calcular_estadistico(MUESTRA, P_H0)
T_EST

9.810370888711903

In [37]:
p_valor = calcular_p_valor(T_EST, len(MUESTRA)-1, 0)
print('Usando el metodo de Pearson')
print(f'El p-valor de la muestra es {p_valor:.2}')

Usando el metodo de Pearson
El p-valor de la muestra es 0.28


Dado que $p-valor=0.28 \ge 0.05=1-0.95$ entonces no podemos descartar que la muestra provenga de la distribucion esperada

In [39]:
p_valor = simular_p_valor(10_000, MUESTRA, P_H0, T_EST)
print('Usando el metodo de Simulacion')
print(f'El p-valor de la muestra es {p_valor:.2}')

Usando el metodo de Simulacion
El p-valor de la muestra es 0.37
