### Prueba para la igualdad de dos distribuciones (localización)

In [59]:
import numpy as np
from scipy.special import binom

In [71]:
class RunsTestEquality:
    """ Clase para implementar la prueba de igualdad de dos distribuciones (localización)
    """
    def __init__(self, x, y):
        """ Constructor de la clase.
        
        :param x: Mediciones de la primera distribución.
        :param y: Mediciones de la segunda distribución.
        """
        self.__x = x
        self.__y = y
        self.__sample = None
        self.__n_1: int = x.size
        self.__n_2: int = y.size
        self.__n: int = self.__n_1 + self.__n_2
        self.__r: int = 1
        self.__merge_data()
        self.__get_runs()
        self.__significance_level = 0.0
    
    def get_x(self):
        return self.__x
    
    def get_y(self):
        return self.__y
    
    def get_runs(self):
        return self.__r
    
    def get_sample(self):
        return self.__sample
    
    def __merge_data(self):
        """
        Método para dicotomizar los datos.
        """
        x = np.sort(self.__x, kind="mergesort")
        y = np.sort(self.__y, kind="mergesort")
        
        merged = [] 
        
        i = 0
        j = 0
        
        while (i < self.__n_1 and j < self.__n_2):
            if x[i] < y[j]:
                merged.append("X")
                i += 1
            elif x[i] > y[j]:
                merged.append("Y")
                j += 1
        
        while i < self.__n_1:
            merged.append("X")
            i += 1
        
        while j < self.__n_2:
            merged.append("Y")
            j += 1
        
        self.__sample = np.array(merged)
        
        
    def __get_runs(self):
        """
        Método para calcular la cantidad de rachas observadas.
        """
        cur = self.__sample[0]
        for i in range(1, self.__sample.size):
            if cur != self.__sample[i]:
                self.__r += 1
            cur = self.__sample[i]
            
    
    def __test_statistics_asymptotic(self):
        """
        Implementa la distribución asintótica de la estadística de prueba.
        """
        pass
    
    def __pmf_even(self, r):
        """
        Función de probabilidad de la estadística de prueba cuando r es par.
        
        :param r: Valor que toma R.
        :return: La probabilidad de que R=r
        """
        num = 2 * binom(self.__n_1 - 1, r / 2 - 1) * binom(self.__n_2 - 1, r / 2 - 1)
        den = binom(self.__n, self.__n_1)
        return num / den
    
    def __pmf_odd(self, r):
        """
        Función de probabilidad de la estadística de prueba cuando r es impar.
        
        :param r: Valor que toma R.
        :return: La probabilidad de que R=r
        """
        num = binom(self.__n_1 - 1, (r - 1) / 2) * binom(self.__n_2 - 1, (r - 3) / 2)
        num += binom(self.__n_1 - 1, (r - 3) / 2) * binom(self.__n_2 - 1, (r - 1) / 2)
        den = binom(self.__n, self.__n_1)
        return num / den
        
    def __test_statistic_exact(self, alpha):
        """
        Calcula las constantes (cuántiles) de la pmf de R tales que la proba acumulada
        sea menor que el nivel de significancia para la prueba de dos colas.
        
        :param alpha: Nivel de significancia deseado.
        :return: Las constantes que definen la región crítica.
        """
        prob = 0.0
        k_1 = 1
        k_2 = self.__n + 1
        while prob <= alpha and (k_1 <= k_2):
            self.__significance_level = prob
            k_1 += 1
            k_2 -= 1
            p_1 = self.__pmf_even(k_1) if (k_1 % 2 == 0) else self.__pmf_odd(k_1)
            p_2 = self.__pmf_even(k_2) if (k_2 % 2 == 0) else self.__pmf_odd(k_2)
            prob += p_1 + p_2
        k_1 -= 1
        k_2 += 1
        return k
    
    def __test_statistic_asymptotic(self, alpha):
        pass
        
    def runs_test(self, alpha=0.05, exact=True):
        if exact:
            k = self.__test_statistic_exact(alpha)
            print(f"Rechazar H_0 si: R <= {k")
            print(f"Valor que tomó la estadística: R_obs = {self.__r}")
            decision = "-> Rechazamos H_0" if (self.__r <= k_1 or self.__r >= k_2) else "-> No rechazamos H_0"
            print(decision + f" con nivel de significancia {self.__significance_level:.3f}")
        else:
            pass
    

In [72]:
x = np.array([-1, 2, 6, 7, 9])
y = np.array([0, 1, 8, 10, 11, 12])

In [73]:
tester = RunsTestEquality(x,y)

In [74]:
tester.get_x()

array([-1,  2,  6,  7,  9])

In [75]:
tester.get_y()

array([ 0,  1,  8, 10, 11, 12])

In [76]:
tester.get_sample()

array(['X', 'Y', 'Y', 'X', 'X', 'X', 'Y', 'X', 'Y', 'Y', 'Y'], dtype='<U1')

In [77]:
tester._RunsTestEquality__r

6

In [78]:
tester.get_runs()

6

In [103]:
x = np.random.normal(loc=1, size=56)
y = np.random.normal(loc=1, size=78)
t = RunsTestEquality(x, y)

In [104]:
t.get_sample()

array(['Y', 'X', 'Y', 'Y', 'X', 'Y', 'Y', 'Y', 'X', 'Y', 'X', 'Y', 'X',
       'Y', 'Y', 'Y', 'X', 'X', 'Y', 'Y', 'Y', 'X', 'Y', 'Y', 'X', 'Y',
       'X', 'Y', 'Y', 'X', 'X', 'X', 'Y', 'Y', 'Y', 'Y', 'X', 'X', 'Y',
       'Y', 'X', 'Y', 'X', 'Y', 'X', 'X', 'Y', 'X', 'X', 'X', 'X', 'X',
       'X', 'X', 'Y', 'X', 'X', 'Y', 'Y', 'X', 'Y', 'Y', 'Y', 'Y', 'Y',
       'Y', 'Y', 'Y', 'Y', 'Y', 'X', 'Y', 'Y', 'X', 'Y', 'X', 'Y', 'Y',
       'X', 'Y', 'Y', 'X', 'Y', 'X', 'X', 'Y', 'Y', 'Y', 'X', 'X', 'Y',
       'X', 'X', 'Y', 'X', 'X', 'X', 'Y', 'Y', 'Y', 'Y', 'Y', 'Y', 'X',
       'X', 'X', 'Y', 'X', 'Y', 'X', 'Y', 'Y', 'Y', 'X', 'Y', 'Y', 'Y',
       'Y', 'Y', 'X', 'X', 'X', 'Y', 'Y', 'Y', 'X', 'Y', 'X', 'Y', 'Y',
       'X', 'Y', 'X', 'Y'], dtype='<U1')

In [105]:
t.runs_test()

Rechazar H_0 si: R <= 55 o si R => 81
Valor que tomó la estadística: R_obs = 71
-> No rechazamos H_0 con nivel de significancia 0.034
