In [21]:
from scipy.stats import poisson, chi2, binom

In [30]:
def T(k, n, p_i, N):
    """
    Estadístico Chi Cuadrado.

    Args:
        k (int): cantidad de valores que puede tomar la variable aleatoria
        n (int): tamaño muestral
        p_i (list[float]): probabilidades teóricas para cada valor que puede
        tomar la distribución de la hipótesis nula
        N (list[int]): frecuencias observadas

    Returns:
        t (float): estadístico Chi Cuadrad observado a partir de la muestra
    """
    t = 0
    for i in range(k):
        t += (N[i] - n*p_i[i])**2 / (n*p_i[i])
    return t

Sea X la v.a. que cuenta el número de tornados observados en una región particular en el período de un mes. Se toman los valores de X a lo largo de 20 meses y se obtuvieron los siguientes datos:

&emsp; [2, 1, 1, 8, 0, 5, 10, 4, 2, 2, 3, 3, 4, 6, 3, 3, 2, 4, 5, 6]

Un investigador realiza una prueba con la siguiente hipótesis: "Los datos corresponden a una distribución de Poisson con parámetro λ=3", considerando las frecuencias del 0, 1, 2, 3, 4, 5 y agrupando todos los valores mayores o iguales a 6.

In [45]:
# Muestra
X = [2, 1, 1, 8, 0, 5, 10, 4, 2, 2, 3, 3, 4, 6, 3, 3, 2, 4, 5, 6]

# Tamaño muestral
n = len(X)

# Frecuencias observadas
# Como una variable Poisson toma infinitos valores, se agrupan en una cantidad finita:
# los que toman el valor 0, 1, 2, 3, 4, 5 y los mayores o iguales a 6
k = 7
N = [0] * k
for x in X:
    if x < 6:
        N[x] += 1
    else:
        N[6] += 1

# Probabilidades usando la distribución establecida en la hipótesis nula
p_i = [0] * k
for i in range(6):
    p_i[i] = poisson.pmf(i, mu=3)
p_i[6] = 1 - poisson.cdf(5, mu=3)

# Estadístico Chi Cuadrado
t = T(k, n, p_i, N)
print(f'Valor observado del estadístico T: {round(t,4)}')

Valor observado del estadístico T: 3.6798


**Aproximación del p-valor utilizando la prueba de Pearson con aproximación chi-cuadrada**

In [48]:
p_valor = 1 - chi2.cdf(t, k-1)
print(f'Aproximación del p-valor con Chi-cuadrado: {round(p_valor,4)}')

Aproximación del p-valor con Chi-cuadrado: 0.7199


**Aproximación del p-valor utilizando una simulación**

In [42]:
# Para la simulación, genero las frecuencias observadas
nSim = 1000
p_valor = 0
for i in range(nSim):
    X = poisson.rvs(mu=3, size=n)
    N = [0] * k
    for x in X:
        if x < 6:
            N[x] += 1
        else:
            N[6] += 1
    t_i = T(k, n, p_i, N)
    if t_i >= t:
        p_valor += 1
print(f'Aproximación del p-valor con {nSim} simulaciones: {p_valor / nSim}')

Aproximación del p-valor con 1000 simulaciones: 0.711
