# Teste Qui-Qudrático
---

O teste Qui-Quadrado (ou teste do Chi-quadrado) é um teste estatístico utilizado para determinar se há uma associação significativa entre variáveis categóricas. Ele compara as frequências observadas em uma amostra com as frequências esperadas sob a hipótese nula (que assume que não há associação entre as variáveis).

Existem dois tipos principais de testes Qui-Quadrado:

Teste de independência: Verifica se duas variáveis categóricas são independentes. Exemplo: se o gênero e a preferência por um determinado produto estão associados.

Teste de aderência (ou bondade de ajuste): Avalia se as frequências observadas de uma variável categórica seguem uma distribuição esperada. Exemplo: se as frequências observadas de cores de bolas em um saco seguem uma distribuição uniforme.

A estatística do Qui-Quadrado é calculada como:

$$\chi^2 = \sum \frac{(O_i - E_i)^2}{E_i}$$

Onde:

OiO_iOi​ são as frequências observadas.

EiE_iEi​ são as frequências esperadas.

Valores elevados de $\chi^2$ indicam uma grande diferença entre as frequências observadas e esperadas, sugerindo que as variáveis podem não ser independentes ou que os dados não seguem a distribuição esperada.


## Exemplo I

Vamos verificar se há uma associação significativa entre a faixa etária e a preferência pelo produto.

In [1]:
import numpy as np
from scipy.stats import chi2_contingency

# Dados: tabela de contingência
# Linhas: Faixa Etária (Jovem, Adulto)
# Colunas: Preferência por Produto (A, B)
tabela_contingencia = np.array([[20, 15], [30, 25]])

# Realiza o teste Qui-Quadrado
chi2, p_valor, graus_de_liberdade, frequencias_esperadas = chi2_contingency(tabela_contingencia)

# Exibe os resultados
print(f"Estatística Qui-Quadrado: {chi2}")
print(f"p-valor: {p_valor}")
print(f"Graus de liberdade: {graus_de_liberdade}")
print(f"Frequências esperadas:\n{frequencias_esperadas}")


Estatística Qui-Quadrado: 0.000584415584415605
p-valor: 0.9807132675440436
Graus de liberdade: 1
Frequências esperadas:
[[19.44444444 15.55555556]
 [30.55555556 24.44444444]]


In [3]:
if p_valor < 0.05:
    print('há uma associação entre a faixa etária e a preferência por produto')
else:
    print('Não há evidências suficientes para afirmar isso')

Não há evidências suficientes para afirmar isso


## Exemplo II

Vamos considerar um exemplo onde os resultados do teste Qui-Quadrado indicam uma associação significativa entre variáveis.

In [4]:
import numpy as np
from scipy.stats import chi2_contingency

# Dados: tabela de contingência
# Linhas: Hábito de Fumar (Fuma, Não Fuma)
# Colunas: Condição de Saúde (Doença, Sem Doença)
tabela_contingencia = np.array([[50, 30], [10, 60]])

# Realiza o teste Qui-Quadrado
chi2, p_valor, graus_de_liberdade, frequencias_esperadas = chi2_contingency(tabela_contingencia)

# Exibe os resultados
print(f"Estatística Qui-Quadrado: {chi2}")
print(f"p-valor: {p_valor}")
print(f"Graus de liberdade: {graus_de_liberdade}")
print(f"Frequências esperadas:\n{frequencias_esperadas}")


Estatística Qui-Quadrado: 34.1796875
p-valor: 5.0250744641968505e-09
Graus de liberdade: 1
Frequências esperadas:
[[32. 48.]
 [28. 42.]]


Se o p-valor for menor que 0,05, haverá evidências para concluir que fumar está significativamente associado ao desenvolvimento de doenças.

In [6]:
if p_valor < 0.05:
    print('Possui evidências significativas')
else:
    print('Não possui evidências significativas')

Possui evidências significativas
