## Teste Z (Aula14.ipynb e Aula15.ipynb)

 \
**Quando fazer o teste:**

- Quando se conhece o desvio padrão populacional (σ)
- Para amostras grandes (geralmente n > 30)
- Para testar a média de uma população

**Questão de exemplo:** \
Uma máquina produz perfumes com média de 150 ml e desvio padrão de 2 ml. Uma amostra de 100 frascos teve média de 150,2 ml. A máquina está operando corretamente? (confiança = 95%)

H0 e Ha: \

H0: μ = 150 ml (máquina operando corretamente) \

Ha: μ ≠ 150 ml (máquina não está operando corretamente)

In [None]:
from statsmodels.stats import weightstats
weightstats.ztest(x1=df['Machine 1'], value=150, alternative="two-sided")

Conclusão: \
P-value = 0,31 > 0,05 ⇒ Falhamos em rejeitar H0. A máquina está operando corretamente.

## Teste T (Aula15.ipynb)

**Quando fazer o teste:**

- Quando NÃO se conhece o desvio padrão populacional

- Para amostras pequenas (geralmente n < 30)

- Para testar a média de uma população

**Questão de exemplo:** \
Máquina produz perfumes com média μ = 150 ml. Amostra de 4 frascos teve média 151 ml e desvio padrão amostral s = 2 ml. A máquina está operando corretamente? (confiança = 95%)

H0 e Ha:

H0: μ = 150 ml (máquina operando corretamente)

Ha: μ ≠ 150 ml (máquina não está operando corretamente)

In [None]:
from scipy import stats
stats.ttest_1samp(volume, 150)

Conclusão:
P-value = 0,39 > 0,05 ⇒ Falhamos em rejeitar H0. A máquina está operando corretamente.

## Teste de uma Proporção (Aula16.ipynb)

**Quando fazer o teste:**

- Para testar proporções (porcentagens) em uma população

- Quando os dados são categóricos (sim/não, sucesso/fracasso)

**Questão de exemplo:** \
Taxa de fumantes em uma cidade era 21%. Amostra de 100 habitantes encontrou 14 fumantes. A proporção mudou? (confiança = 95%)

H0 e Ha:

H0: p = 0,21 (proporção não mudou)

Ha: p ≠ 0,21 (proporção mudou)

In [None]:
from scipy import stats
stats.binomtest(14, 100, p=0.21, alternative="two-sided")

Conclusão:
P-value = 0,11 > 0,05 ⇒ Falhamos em rejeitar H0. A proporção de fumantes não mudou significativamente.

## Teste Chi-Quadrado para Variância (Aula 17)


**Quando Fazer o Teste**

- Quando você deseja testar se a variância (ou desvio padrão) de uma população é igual a um valor específico.

- Útil para verificar a consistência de processos (ex: máquinas de envase, produção).

- A amostra deve ser aleatória e a população deve ter distribuição normal (ou aproximadamente normal).

**Questão de exemplo:** \
Uma amostra de 51 frascos de perfume foi coletada. O desvio padrão desses frascos foi 2,35 ml. Houve um aumento no desvio padrão, estabelecido como 2 ml? (nível de confiança: 90%)

H0 e Ha:

H0: σ² ≤ 4 ml² (variância não aumentou).

Ha: σ² >4 ml² (variância aumentou).

In [None]:
## Calcular a estatística Chi-Quadrado
Chi_sq_cal = (51-1)*(2.35**2)/(2**2)  # Resultado: 69.03

In [None]:
## Valor critico
stats.chi2.isf(0.10, 50)  # Resultado: 63.17

Conclusão:
Como Xcal = 69.03 > Xcrit = 63.17. Há evidências de que o desvio padrão aumentou.

## Teste Z de Duas Amostras (Aula 18)

**Quando fazer o teste:**

- O teste Z de duas amostras é utilizado para comparar as médias de duas populações independentes, quando:

- As amostras são grandes (geralmente n ≥ 30 para cada amostra).

- Os desvios padrão das populações são conhecidos ou as amostras são suficientemente grandes para aproximar a distribuição normal.

- O objetivo é verificar se as médias das duas populações são estatisticamente diferentes.



**Questão de Exemplo:**

Duas máquinas envasam produtos com volumes diferentes. Os volumes das amostras são:

Máquina 1: [150, 152, 154, 152, 151]

Máquina 2: [156, 155, 158, 155, 154]

Verifique se as médias dos volumes envasados pelas duas máquinas são diferentes, com 95% de confiança.

Hipótese Nula (H0): As médias das duas amostras são iguais (μ1 = μ2).

Hipótese Alternativa (Ha): As médias das duas amostras são diferentes (μ1 ≠ μ2).

In [None]:
import scipy.stats as stats
from statsmodels.stats import weightstats

m1 = [150, 152, 154, 152, 151]
m2 = [156, 155, 158, 155, 154]

# Realizando o teste Z
resultado = weightstats.ztest(m1, m2)
print(resultado)

Conclusão: Como o pValue (0.0039) é menor que o nível de significância (0.05), o que significa que há evidências estatísticas para rejeitar a hipótese nula.

## Teste T Pareado (Aula 19)

**Quando fazer o teste:**

- Quando você tem duas amostras relacionadas (medidas repetidas no mesmo grupo, como antes e depois de um tratamento).

- Quando os dados são normalmente distribuídos.

- Quando o objetivo é comparar as médias das duas condições relacionadas.

**Questão de Exemplo:** \
A pressão sistólica de 5 pacientes foi medida antes e depois da administração de um medicamento. Houve alteração na pressão? Nível de confiança = 95%.

pAntes = [120, 122, 143, 100, 109]

pDepois = [122, 120, 141, 109, 109]

H0 e Ha:

H0: μAntes = μDepois (não há diferença na pressão)

Ha: μAntes <> μDepois (há diferença na pressão)

In [None]:
import scipy.stats as stats
stats.ttest_rel(pAntes, pDepois)

Como o valor-p (0.530) é maior que o nível de significância (0.05), falhamos em rejeitar H0. Portanto, não há evidências suficientes para afirmar que o medicamento alterou a pressão arterial dos pacientes.

## Teste de Duas Proporções (Aula 20)

**Quando fazer o teste:**

- Quando você quer comparar proporções de duas amostras independentes.

- Quando os dados são categóricos (ex: sucesso/falha) e você quer verificar se há diferença significativa entre os grupos.

- Quando o tamanho das amostras é grande o suficiente para aproximação normal (regra geral:
n ⋅ p ≥ 5 e n⋅(1-p)≥5).

**Questão de Exemplo:** \
Em uma amostra de 200 itens do fornecedor A, 30 estavam defeituosos. Em outra amostra de 100 itens do fornecedor B, 10 estavam defeituosos. Há diferença significativa na qualidade? Nível de confiança: 95%.

H0 e Ha:

H0: μA = μB (não há diferença nas proporções de defeitos)

Ha: μA <> μB (há diferença nas proporções de defeitos)

In [None]:
from statsmodels.stats import proportion
proportion.test_proportions_2indep(30, 200, 10, 100, method='score')

In [None]:
Como o pValue (0.231) é maior que o nível de significância (0.05), falhamos em rejeitar H0. Não há evidências de diferença na qualidade entre os fornecedores A e B.

## Teste de Duas Variâncias (Aula 21)

**Quando fazer o teste:**

- Quando você quer comparar as variâncias de duas amostras independentes.

- Quando os dados são normalmente distribuídos (o teste é sensível a não normalidade).

- Antes de realizar testes que assumem igualdade de variâncias (ex: teste t para duas amostras).

**Questão de Exemplo:**

O desvio padrão de 8 amostras da máquina A foi 1.1. A variância de 5 amostras da máquina B foi 11. Há diferença entre as variâncias? Nível de confiança: 90%.

H0 e Ha:

H0: σA² = σB² ml² (as variâncias são iguais).

Ha: σA² <> σB² ml² (as variâncias não são iguais).

In [1]:
## Manual

F_calculado = 11 / (1.1**2)  # F = variância maior / variância menor
F_critico_direita = f.isf(0.05, dfn=4, dfd=7)  # dfn = n1-1, dfd = n2-1
F_critico_esquerda = f.isf(0.95, dfn=4, dfd=7)

# Como 9.09>4.12, rejeitamos H0. Há diferença significativa entre as variâncias das máquinas A e B.

## Código Direto
stats.levene(m1, m2)  # Teste de Levene (robusto a não normalidade)

**Conclusão:** \
Como pValue = 0.040 < 0.1, rejeitamos a hipotese nula.

## Teste ANOVA (Aula 22)

**Quando fazer o teste:**

- Quando você deseja comparar as médias de três ou mais grupos independentes.

- Quando os dados são normalmente distribuídos e as variâncias dos grupos são aproximadamente iguais (homocedasticidade).

- Quando o objetivo é determinar se há diferenças estatisticamente significativas entre as médias dos grupos.

**Questão de Exemplo:**

Amostras foram obtidas de 3 máquinas de envase de perfume. Com base nessas amostras, é correto afirmar que as 3 máquinas estão operando de forma idêntica, ou seja, produzindo perfumes com a mesma média? Nível de confiança: 95%.

m1 = [150, 150, 151, 148, 151, 152, 149, 150]

m2 = [153, 152, 148, 151, 149, 152]

m3 = [156, 154, 155, 156, 157, 155]

H0 e Ha:

H0: μ1 = μ2 = μ3 (as médias são iguais)

Ha: μ1 <> μ2 <> μ3 (pelo menos uma média é diferente)

In [None]:
import scipy.stats as stats
stats.f_oneway(m1, m2, m3)

Como o valor-p (3.237e-05) é menor que o nível de significância (0.05), rejeitamos H0. Portanto, há evidências suficientes para afirmar que as médias das três máquinas não são iguais.

