# Projeto: Teste A/B - Votação da Lei dos Direitos Civis de 1964
A Lei dos Direitos Civis de 1964 (<https://pt.wikipedia.org/wiki/Lei_dos_Direitos_Civis_de_1964>) foi uma das leis mais importantes já aprovadas nos EUA. Excluindo os votos "presentes" e "abstenção", 153 democratas da câmara e 136 republicanos votaram "sim". No entanto, 91 democratas e 35 republicanos votaram contra. A afiliação do partido fez diferença na votação?

Para responder essa pergunta, avaliarei a hipótese de que o partido do membro da câmara não teve influência no seu voto. Usarei a fração de democratas que votaram a favor como estatística de teste (em 1964, foram os democratas que foram menos progressistas em questões de direitos civis). Para fazer isso, permutarei os rótulos partidários dos eleitores da câmara e depois os dividirei arbitrariamente em "Democratas" e "Republicanos", e depois calcularei a fração dos democratas que votaram "sim".

In [1]:
# bibliotecas necessárias
import numpy as np
np.random.seed(seed=1)

## Gerando amostra de permutação
A amostragem por permutação é uma ótima maneira de simular a hipótese de que duas variáveis têm distribuições de probabilidade idênticas. Geralmente, essa é uma hipótese que se procura testar, portanto escreverei uma função para gerar uma amostra de permutação a partir de dois conjuntos de dados.

Lembrando de que uma amostra de permutação de duas arrays, respectivamente com entradas n1 e n2, é construída concatenando as arrays, misturando o conteúdo da array concatenada, e em seguida tendo as primeiras entradas n1 como amostra de permutação da primeira array, e as últimas entradas n2 como a amostra de permutação da segunda array.

In [2]:
def permutation_sample(data1, data2):
    """Gerando uma amostra permutada de dois data sets."""

    # concatenando os data sets
    data = np.concatenate((data1, data2))

    # permutando a array concatenada
    permuted_data = np.random.permutation(data)

    # explodindo a array permutada em dois: perm_sample_1, perm_sample_2
    perm_sample_1 = permuted_data[:len(data1)]
    perm_sample_2 = permuted_data[len(data1):]

    return perm_sample_1, perm_sample_2

## Gerando réplicas de permutação
Uma réplica de permutação é um valor único de uma estatística calculada a partir de uma amostra de permutação.

Algo importante sobre o argumento "func" dessa função, é que essa deve ser uma função que aceita duas matrizes como argumentos.

In [3]:
def draw_perm_reps(data_1, data_2, func, size=1):
    """Gerando múltiplas réplicas de permutação."""

    # array de réplicas vazias: perm_replicates
    perm_replicates = np.empty(size)

    for i in range(size):
        # amostra de permutação
        perm_sample_1, perm_sample_2 = permutation_sample(data_1, data_2)

        # teste estatístico
        perm_replicates[i] = func(perm_sample_1, perm_sample_2)

    return perm_replicates

## Gerando as arrays
Construindo arrays booleanas, "dems" e "reps", que contenham os votos dos respectivos partidos, por exemplo "dems" tem 153 entradas verdadeiras e 91 entradas falsas.

In [4]:
# arrays com os dados: dems, reps
dems = np.array([True] * 153 + [False] * 91)
reps = np.array([True] * 136 + [False] * 35)

## Democratas que votaram "sim" e que votaram contra :(
Função, frac_yea_dems(dems, reps), que retorna a fração dos democratas que votaram sim. A primeira entrada é uma array de booleanos. Duas entradas são necessárias para usar a função draw_perm_reps(), mas a segunda não é usada.

In [5]:
def frac_yea_dems(dems, reps):
    """Computando a fração dos democratas que votaram "sim"."""
    frac = np.sum(dems) / len(dems)
    return frac

In [6]:
# gerando permutações dos democratas que votaram sim: perm_replicates
perm_replicates = draw_perm_reps(dems, reps, frac_yea_dems, 10000)

# p-valor
p = np.sum(perm_replicates <= 153/244) / len(perm_replicates)
print('p-value =', p)

p-value = 0.0003


Esse p-valor evidencia que o partido teve influência na votação. É importante ressaltar que o Sul tinha uma fração maior de representantes democratas e consequentemente também um viés mais racista.