## Teste de Duas Proporções

### Métodos para o teste de proporções para duas amostras independentes

1. **`'score'`** (método de score):
   * Esse método usa uma aproximação da **razão de verossimilhança** e é comum em testes de hipóteses baseados em distribuições normais para grandes amostras.
   * Ele é útil quando as amostras são grandes o suficiente para aplicar a aproximação normal.

2. **`'wald'`** (método de Wald):
   * O **método de Wald** é um outro teste de proporções baseado na distribuição normal, mas usa uma fórmula ligeiramente diferente para calcular o erro padrão e a estatística de teste.
   * Pode ser usado quando a amostra é suficientemente grande e a distribuição das proporções é aproximada por uma normal.

3. **`'binom'`** (método binomial exato):
   * Esse método usa o **teste binomial exato**, que é uma abordagem mais precisa, especialmente quando as amostras são pequenas.
   * Ele não faz suposições de normalidade e calcula a significância com base na distribuição binomial.

4. **`'asymptotic'`** (método assintótico):
   * O **método assintótico** usa uma aproximação baseada na distribuição normal. Ele é chamado "assintótico" porque a aproximação se torna mais precisa à medida que o tamanho da amostra aumenta.
   * É útil quando se lida com grandes amostras.

5. **`'exact'`** (método exato):
   * O **teste exato** (geralmente baseado em técnicas como o teste exato de Fisher) é usado quando as amostras são pequenas e a distribuição das variáveis de interesse não pode ser bem aproximada por uma distribuição normal.
   * É mais preciso, mas pode ser mais lento em amostras grandes.
   

Em uma amostra de 200 itens de um fornecedor A foram encontrados 30 itens defeituosos. Em outra amostra de 100 itens de um fornecedor B foram encontrados 10 defeituosos. Há uma diferença significativa na qualidade dos produtos desses fornecedores? Nível de confiança: 95%.

H0: p1 - p2 = 0 \
Ha: p1 - p2 ≠ 0

In [None]:
from statsmodels.stats import proportion

# Argumentos da função:
# 30: O número de sucessos (eventos de interesse) na primeira amostra.
# 200: O tamanho da primeira amostra (total de observações ou elementos na primeira amostra).
# 10: O número de sucessos na segunda amostra.
# 100: O tamanho da segunda amostra (total de observações ou elementos na segunda amostra).

proportion.test_proportions_2indep(30, 200, 10, 100, method='score')

<class 'statsmodels.stats.base.HolderTuple'>
statistic = 1.1989578808281796
pvalue = 0.2305443235633593
compare = 'diff'
method = 'score'
variance = 0.001739130434782609
alternative = 'two-sided'
prop1_null = 0.13333333333333333
prop2_null = 0.13333333333333333
tuple = (1.1989578808281796, 0.2305443235633593)
diff = 0.04999999999999999
ratio = 1.4999999999999998
odds_ratio = 1.588235294117647
value = 0

Tendo em vista que P Value = 0,23 que é maior que 0,05, falhamos em rejeitar a hipótese nula. Portanto, não há diferença significativa na qualidade dos produtos A e B.

Exercício \
Em um estudo de 200 mulheres adultas selecionadas aleatoriamente e 250 homens adultos, ambos usuários de Internet, 30% das mulheres e 38% dos homens disseram que planejam comprar online ao menos uma vez no mês seguinte. Ao nível de confiança de 90%, testar a afirmação de que há uma diferença entre a proporção de homens e mulheres, usuários de Internet, que planejam comprar online. \
A) Calcular manualmente \
B) Calcular utilizando o Python

H0: p1 - p2 = 0 \
Ha: p1 - p2 ≠ 0

In [4]:
proportion.test_proportions_2indep(60, 200, 95, 250, method='score')

<class 'statsmodels.stats.base.HolderTuple'>
statistic = -1.772643092104187
pvalue = 0.0762878664367035
compare = 'diff'
method = 'score'
variance = 0.0020367483296213807
alternative = 'two-sided'
prop1_null = 0.34444444444444444
prop2_null = 0.34444444444444444
tuple = (-1.772643092104187, 0.0762878664367035)
diff = -0.08000000000000002
ratio = 0.7894736842105263
odds_ratio = 0.6992481203007519
value = 0

Como P Value < 0.1, rejeitamos a hipótese nula. Portanto, HÁ diferença na proporção de homens e mulheres que planejam comprar online no mês seguinte.