# Teste de Permutação Exaustiva

Em vez de simplesmente embaralhar aleatoriamente e dividir os dados, nós na verdade adivinhamos **todos os modos possíveis em que podem ser divididos**. Isso é prático apenas para tamanhos de amostra relativamente pequenos. Tem a propriedade de garantir que o modelo nulo não seja testato como ‘significante’ além do nível alfa do teste.

In [2]:
import numpy as np
from itertools import permutations

# Função para calcular a diferença de médias entre dois grupos
def diff_of_means(data, group1, group2):
    return np.mean([data[i] for i in group1]) - np.mean([data[i] for i in group2])

# Função para realizar o teste de permutação exaustiva
def permutation_test(data, group1, group2):
    n = len(group1) + len(group2)
    obs_diff = diff_of_means(data, group1, group2)
    
    # Todas as permutações possíveis das posições dos elementos
    all_perms = list(permutations(range(n)))
    count = 0
    
    # Contar quantas vezes a diferença de médias permutada é maior ou igual à observada
    for perm in all_perms:
        perm_group1 = perm[:len(group1)]
        perm_group2 = perm[len(group1):]
        perm_diff = diff_of_means(data, perm_group1, perm_group2)
        if abs(perm_diff) >= abs(obs_diff):
            count += 1
    
    # P-valor como a proporção de permutações que excedem a diferença observada
    p_value = count / len(all_perms)
    return p_value

# Exemplo de uso
np.random.seed(42)
group1 = np.array([23, 45, 67, 89, 12])
group2 = np.array([56, 78, 34, 90, 13])

# Unir os grupos para facilitar a permutação
data = np.concatenate((group1, group2))
n1 = len(group1)
n2 = len(group2)

# Índices dos grupos
indices1 = list(range(n1))
indices2 = list(range(n1, n1 + n2))

# Realizar o teste de permutação
p_value = permutation_test(data, indices1, indices2)
print(f"P-valor do teste de permutação exaustiva: {p_value:.4f}")


P-valor do teste de permutação exaustiva: 0.6984


# Teste de Permutação Bootstrap

O teste de permutação por bootstrap é uma técnica que combina a ideia de permutação com o reamostramento bootstrap para testar hipóteses sobre as diferenças entre grupos. Em vez de calcular todas as permutações possíveis (como em um teste de permutação exaustiva), o bootstrap permite gerar muitas amostras aleatórias, tornando o processo mais eficiente, especialmente para conjuntos de dados maiores.

In [3]:
import numpy as np

# Função para calcular a diferença de médias entre dois grupos
def diff_of_means(data, group1, group2):
    return np.mean(group1) - np.mean(group2)

# Função para realizar o teste de permutação por bootstrap
def bootstrap_permutation_test(group1, group2, num_iterations=10000):
    data = np.concatenate((group1, group2))
    n1 = len(group1)
    observed_diff = diff_of_means(data, group1, group2)
    
    count = 0
    for _ in range(num_iterations):
        # Permutar os dados e dividir novamente em dois grupos
        permuted_data = np.random.permutation(data)
        perm_group1 = permuted_data[:n1]
        perm_group2 = permuted_data[n1:]
        
        # Calcular a diferença de médias
        perm_diff = diff_of_means(data, perm_group1, perm_group2)
        
        # Contar quantas vezes a diferença permutada é maior ou igual à observada
        if abs(perm_diff) >= abs(observed_diff):
            count += 1
    
    # P-valor como a proporção de permutações que excedem a diferença observada
    p_value = count / num_iterations
    return p_value

# Exemplo de uso
np.random.seed(42)
group1 = np.array([23, 45, 67, 89, 12])
group2 = np.array([56, 78, 34, 90, 13])

# Realizar o teste de permutação por bootstrap
p_value = bootstrap_permutation_test(group1, group2, num_iterations=10000)
print(f"P-valor do teste de permutação por bootstrap: {p_value:.4f}")


P-valor do teste de permutação por bootstrap: 0.6998


Os testes de permutação são úteis em procedimentos heurísticos para a exploração do papel da variação aleatória. Eles são relativamente **simples** de serem codificados, interpretados e explicar e oferecem um desvio útil do redor do formalismo e 'falso determinismo' das estatísticas baseadas em fórmulas. 

O resultado chega muito mais perto de uma abordagem de **'tamanho' único** à inferência. Os dados podem ser númericos ou binários. Os tamanhos podem ser iguais ou diferentes. As suposições sobre os dados normalmente distribuídos não são necessárias.

---

## Ideias-chave

*   Em um teste de permutação, múltiplas amostras são **combinadas** e então **embaralhadas**
*   Os **valores embaralhados** são então **divididos** em reamostras, e a estatística de interesse é **calculada**.
*   Esse processo é então **repetido**, e a estatística **reamostrada** é tabulada.
*   A comparação dos valores observados da estatística com a distribuição reamostrada permite julgar se uma diferença observada entre as amostras pode ocorre por acaso.



## Código

In [4]:
import numpy as np

# Função para calcular a diferença de médias entre dois grupos
def diff_of_means(data, group1, group2):
    return np.mean(group1) - np.mean(group2)

# Função para realizar o teste de permutação por bootstrap
def bootstrap_permutation_test(group1, group2, num_iterations=10000):
    data = np.concatenate((group1, group2))
    n1 = len(group1)
    observed_diff = diff_of_means(data, group1, group2)
    
    count = 0
    for _ in range(num_iterations):
        # Permutar os dados e dividir novamente em dois grupos
        permuted_data = np.random.permutation(data)
        perm_group1 = permuted_data[:n1]
        perm_group2 = permuted_data[n1:]
        
        # Calcular a diferença de médias
        perm_diff = diff_of_means(data, perm_group1, perm_group2)
        
        # Contar quantas vezes a diferença permutada é maior ou igual à observada
        if abs(perm_diff) >= abs(observed_diff):
            count += 1
    
    # P-valor como a proporção de permutações que excedem a diferença observada
    p_value = count / num_iterations
    return p_value

# Exemplo de uso
np.random.seed(42)
group1 = np.array([23, 45, 67, 89, 12])
group2 = np.array([56, 78, 34, 90, 13])

# Realizar o teste de permutação por bootstrap
p_value = bootstrap_permutation_test(group1, group2, num_iterations=10000)
print(f"P-valor do teste de permutação por bootstrap: {p_value:.4f}")


P-valor do teste de permutação por bootstrap: 0.6998
