In [7]:
import pandas as pd
import numpy as np
from statsmodels.sandbox.stats.runs import runstest_1samp

def teste_corridas(seq_str):
    seq_binaria = np.array(list(seq_str), dtype=int)

    # Contagem de 1s e 0s
    n_1s = np.sum(seq_binaria)
    n_0s = len(seq_binaria) - n_1s

    # Aplicando o teste de corridas
    stat, p_val = runstest_1samp(seq_binaria, cutoff='mean', correction=True)

    # Exibindo os resultados
    print(f"Sequência: {seq_str}")
    print(f"Tamanho: {len(seq_binaria)}")
    print(f"Número de 1's: {n_1s}")
    print(f"Número de 0's: {n_0s}")
    print(f"p-valor do teste de corridas: {p_val}")


print(f"--------------------------------------------- Exemplo 1 (12.5.a)")
teste_corridas("111011011010110111101011101010")
print()

print(f"--------------------------------------------- Exemplo 2 (12.5.b)")
teste_corridas("1111010111100000010")


--------------------------------------------- Exemplo 1 (12.5.a)
Sequência: 111011011010110111101011101010
Tamanho: 30
Número de 1's: 20
Número de 0's: 10
p-valor do teste de corridas: 0.030029523089124485

--------------------------------------------- Exemplo 2 (12.5.b)
Sequência: 1111010111100000010
Tamanho: 19
Número de 1's: 10
Número de 0's: 9
p-valor do teste de corridas: 0.35000274108592755


In [None]:
import numpy as np
import scipy.stats as stats

def count_runs(sequence):
    runs = 1
    for i in range(1, len(sequence)):
        if sequence[i] != sequence[i-1]:
            runs += 1
    return runs

def runs_test_using_scipy(n, m, r_obs):
    N = n + m
    # Média e desvio padrão do número de corridas para uma sequência aleatória
    mu = (2 * n * m) / N + 1
    sigma = np.sqrt((2 * n * m * (2 * n * m - N)) / (N**2 * (N - 1)))

    # Calculando a estatística Z
    Z = (r_obs - mu) / sigma

    # Calculando o p-valor para o teste bilateral
    p_value = 2 * (1 - stats.norm.cdf(abs(Z)))

    return round(p_value, 5)

def testa_sequencia(seq_str):
    seq_binaria = np.array(list(seq_str), dtype=int)
    n = np.sum(seq_binaria)
    m = len(seq_binaria) - n

    if n == 0 or m == 0:
        runs = np.nan
        p_val = np.nan
    else:
        # Conta o número de corridas na sequência
        runs = count_runs(seq_binaria)
        # Realiza o teste de corridas e calcula o p-valor usando a função scipy
        p_val = runs_test_using_scipy(n, m, runs)

    print(f"Sequência: {seq_str}")
    print(f"Tamanho: {len(seq_binaria)}")
    print(f"Número de 1's: {n}")
    print(f"Número de 0's: {m}")
    print(f"Número de corridas (runs): {runs}")
    print(f"p-valor do teste de corridas: {p_val}")
    print("--------------------------------------------------")

# Sequências para testar
sequencias = [
    "111011011010110111101011101010",  # Exemplo da Página 545 (12.5.a)
    "1111010111100000010"              # Exemplo da Página 346 (12.5.b)
]

for seq in sequencias:
    testa_sequencia(seq)


Sequência: 111011011010110111101011101010
Tamanho: 30
Número de 1's: 20
Número de 0's: 10
Número de corridas (runs): 20
p-valor do teste de corridas: 0.01733
--------------------------------------------------
Sequência: 1111010111100000010
Tamanho: 19
Número de 1's: 10
Número de 0's: 9
Número de corridas (runs): 8
p-valor do teste de corridas: 0.24146
--------------------------------------------------


In [None]:
import numpy as np
import math

def binom(n, k):
    if 0 <= k <= n:
        return math.comb(n, k)
    return 0

def runs_test_exact(n, m, r_obs):
    N = n + m
    total_permutations = binom(N, n)

    def prob_r_equals_k(k):
        if k % 2 == 0:
            k_half = k // 2
            return 2 * binom(m - 1, k_half - 1) * binom(n - 1, k_half - 1) / total_permutations
        else:
            k_half = (k - 1) // 2
            term1 = binom(m - 1, k_half - 1) * binom(n - 1, k_half)
            term2 = binom(m - 1, k_half) * binom(n - 1, k_half - 1)
            return (term1 + term2) / total_permutations

    probs = [prob_r_equals_k(k) for k in range(2, N + 1)]
    p_lower = sum(probs[:r_obs - 1])
    p_upper = sum(probs[r_obs - 2:])
    p_value = 2 * min(p_lower, p_upper)
    return round(p_value, 5)

def count_runs(sequence):
    runs = 1
    for i in range(1, len(sequence)):
        if sequence[i] != sequence[i-1]:
            runs += 1
    return runs

def testa_sequencia(seq_str):
    seq_binaria = np.array(list(seq_str), dtype=int)
    n = np.sum(seq_binaria)
    m = len(seq_binaria) - n

    if n == 0 or m == 0:
        runs = np.nan
        p_val = np.nan
    else:
        runs = count_runs(seq_binaria)
        p_val = runs_test_exact(n, m, runs)

    print(f"Sequência: {seq_str}")
    print(f"Tamanho: {len(seq_binaria)}")
    print(f"Número de 1's: {n}")
    print(f"Número de 0's: {m}")
    print(f"Número de corridas (runs): {runs}")
    print(f"p-valor do teste de corridas: {p_val}")
    print("--------------------------------------------------")

# Sequências para testar
# Livro Introduction to Probability and Statistics for Engineers and Scientists
sequencias = [
    "111011011010110111101011101010", #Exemplo da Página 545 (12.5.a)
    "1111010111100000010" #Exemplo da Página 346 (12.5.b)
]

for seq in sequencias:
    testa_sequencia(seq)


Sequência: 111011011010110111101011101010
Tamanho: 30
Número de 1's: 20
Número de 0's: 10
Número de corridas (runs): 20
p-valor do teste de corridas: 0.01845
--------------------------------------------------
Sequência: 1111010111100000010
Tamanho: 19
Número de 1's: 10
Número de 0's: 9
Número de corridas (runs): 8
p-valor do teste de corridas: 0.35712
--------------------------------------------------
