#🎯 Os 5 Passos de um Teste de Hipótese

**🧠 Passo 1 – Especifique as Hipóteses**

- H₀ (hipótese nula): não há efeito/diferença
- H₁ (hipótese alternativa): há efeito/diferença

**📏 Passo 2 – Defina o Nível de Significância**

- O mais comum é α = 0.05 (5%)
- Significa que aceitamos errar 5% das vezes ao rejeitar H₀

**🧪 Passo 3 – Escolha o Teste Adequado**

 Isso depende de:
  - Tipo de variável (média, proporção, desvio)
  - Número de amostras (1 ou 2 ou mais)
  - Independência entre amostras
  - Conhecimento da distribuição/população

**🧮 Passo 4 – Calcule a Estatística de Teste / Valor-p**

- Usamos bibliotecas como `scipy.stats` ou `statsmodels`
- Obtemos o valor-p e comparamos com α

**✅ Passo 5 – Interprete os Resultados**

- Se `valor-p < α`: rejeita-se H₀
- Se `valor-p ≥ α`: não se rejeita H₀

> Quando falamos de **teste de hipótese** e **intervalo de confiança**, estamos **assumindo que as amostras foram coletadas de forma adequada** e que elas **representam bem a população**, sem viés sistemático.
>
> 🔁 **Se houver dúvidas sobre a representatividade da amostra**, o correto é voltar etapas, revisar os critérios de inclusão/exclusão e **refazer a amostragem**, considerando todos os cenários possíveis.

# 🥺 Diferença entre teste Paramétrico e Não Paramétrico

##✅ Testes Paramétricos

Pressupõem que os dados seguem uma distribuição específica, geralmente a normal (distribuição gaussiana). Usam média e desvio padrão como medidas centrais.

Características principais:
* Exigem dados em escala intervalar ou razão
* São mais poderosos (detectam efeitos reais com maior probabilidade), desde que os pressupostos sejam atendidos
* Requerem normalmente: Normalidade, Homogeneidade de variância, Independência das observações

Exemplos:
* Teste t (uma amostra, duas amostras, pareado)
* ANOVA
* Teste z para proporções
* Bartlett (para variâncias)

##🚫 Testes Não Paramétricos

Não exigem suposições fortes sobre a distribuição dos dados. Podem ser usados com dados ordinais, nominais ou intervalares que não seguem distribuição normal.

Características principais:
* São mais robustos em relação a violações de pressupostos
* Usam medianas, ranks ou frequências em vez de médias
* Úteis quando Dados não seguem distribuição normal, Amostras pequenas, Presença de outliers

Exemplos:
* Mann-Whitney U test (duas amostras independentes)
* Wilcoxon (pareado)
* Kruskal-Wallis (mais de dois grupos)
* Qui-quadrado
* McNemar
* Levene (variações entre grupos sem assumir normalidade)

# 🙂‍ Cenários Clássicos de Aplicação

## 📊 Testes para Distribuição

### Teste de Anderson-Darling

* **Amostras**: 1 amostra
* **Amostras independentes**: Não se aplica
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Paramétrico
* **Explicação**: Avalia se uma amostra segue uma determinada distribuição específica
* **Método/Função Python**: scipy.stats.anderson(x=)
* **Parâmetro**: x = lista ou array de dados
* **Exemplo**: Antes de aplicar um teste t, um pesquisador em saúde testa se a pressão arterial dos pacientes segue distribuição normal.

### Teste de Jarque-Bera

* **Amostras**: 1 amostra
* **Amostras independentes**: Não se aplica
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Paramétrico
* **Explicação**: Teste de normalidade baseado em assimetria e curtose.
* **Método/Função Python**: scipy.stats.jarque_bera(x=)
* **Parâmetro**: x = lista ou array de dados
* **Exemplo**: Um analista deseja saber se o tempo de internação hospitalar pode ser considerado normal para usar modelos paramétricos.

###Teste de Shapiro-Wilk

* **Amostras**: 1 amostra
* **Amostras independentes**: Não se aplica
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Paramétrico
* **Explicação**: Um dos testes mais comuns para verificar normalidade de uma amostra.
* **Método/Função Python**: scipy.stats.shapiro(x=)
* **Parâmetro**: x = lista ou array de dados
* **Exemplo**: Antes de comparar a glicemia de dois grupos, o pesquisador aplica o Shapiro-Wilk para checar se os dados são normais.

### Teste de Kolmogorov-Smirnov (KS)

* **Amostras**: 2 amostras
* **Amostras independentes**: Sim
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Não Paramétrico
* **Explicação**: Compara se duas amostras vem da mesma distribuição
* **Método/Função Python**: scipy.stats.ks_2samp(data1=, data2=)
* **Parâmetro**: data1, data2: lista ou array de dados
* **Exemplo**: Comparar a distribuição de peso ao nascer entre bebês nascidos em dois hospitais diferentes.

## 📊 Testes para Médias

### One-sample t-test

* **Amostras**: 1 amostra
* **Amostras independentes**: Não se aplica
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Paramétrico
* **Explicação**: Compara a média de uma amostra com um valor fixo.
* **Método/Função Python**: scipy.stats.ttest_1samp(a=, popmean=)
* **Parâmetro**: a: lista de dados amostrais; popmean: média populacional
* **Exemplo**: Verificar se a média de gastos mensais de uma clínica está de acordo com o orçamento previsto de R$ 20.000.

### Two-sample t-test

* **Amostras**: 2 amostras
* **Amostras independentes**: Sim
* **Desvio padrão populacional conhecido**: Não
* **Categoria**: Paramétrico
* **Explicação**: Compara médias de dois grupos independentes.
* **Método/Função Python**: scipy.stats.ttest_1samp(a=, popmean=)
* **Parâmetro**: a: lista de dados amostrais; popmean: média populacional
* **Exemplo**: Comparar a média de colesterol entre homens e mulheres.

###Paired t-test

* **Amostras**: 2 amostras
* **Amostras independentes**: Não
* **Desvio padrão populacional conhecido**: Não
* **Categoria**: Paramétrico
* **Explicação**: Compara médias de duas condições na mesma unidade experimental.
* **Método/Função Python**: scipy.stats.ttest_rel(a=, b=)
* **Parâmetro**: a,b: lista de dados amostrais pareados
* **Exemplo**: Comparar o IMC dos pacientes antes e depois de um programa de reeducação alimentar.

###One-way ANOVA

* **Amostras**: 3 ou mais amostras
* **Amostras independentes**: Sim
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Paramétrico
* **Explicação**: Compara médias de mais de dois grupos independentes.
* **Método/Função Python**: scipy.stats.f_oneway(*args)
* **Parâmetro**: *args: listas de dados amostrais de diferentes grupos
* **Exemplo**:  Comparar tempo de espera médio em três unidades básicas de saúde.

### Post-hoc Tukey HSD (V)

* **Amostras**: 2 ou mais amostras
* **Amostras independentes**: Sim
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Paramétrico
* **Explicação**: Testes de comparações múltiplas pós-ANOVA.
* **Método/Função Python**: statsmodels.stats.multicomp.pairwise_tukeyhsd(endog=, groups=)
* **Parâmetro**: endog: variável resposta; groups: grupo categórico
* **Exemplo**: Após identificar diferença geral de desempenho entre três centros cirúrgicos, o gestor usa Tukey para saber quais centros diferem entre si.

## 🔸 Testes para Mediana

### Teste de Mann-Whitney U

* **Amostras**: 2 amostras
* **Amostras independentes**: Sim
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Não Paramétrico
* **Explicação**: Alternativa não paramétrica ao t-test para dois grupos independentes.
* **Método/Função Python**: scipy.stats.mannwhitneyu(x=,y=)
* **Parâmetro**: x,y: lista de dados amostrais
* **Exemplo**: Comparar nível de dor relatado por pacientes que tomaram dois analgésicos diferentes.

### Teste de Wilcoxon Signed-Rank

* **Amostras**: 2 ou mais
* **Amostras independentes**: Sim
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Não Paramétrico
* **Explicação**: Alternativa não paramétrica ao paired t-test.
* **Método/Função Python**: scipy.stats.wilcoxon(x=,y=)
* **Parâmetro**: x,y: lista de dados amostrais pareados
* **Exemplo**: Comparar a escala de estresse dos mesmos trabalhadores antes e depois de intervenção psicológica.

###Brunner-Munzel Test

* **Amostras**: 2 amostras
* **Amostras independentes**: Sim
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Não Paramétrico
* **Explicação**: Testa a igualdade de localização entre duas amostras, robusto à variâncias diferentes.
* **Método/Função Python**: scipy.stats.brunnermunzell(x=,y=)
* **Parâmetro**: x,y: lista de dados amostrais
* **Exemplo**: Comparar número de visitas a médicos entre dois grupos com distribuições assimétricas.

### Sign Test



* **Amostras**: 2 amostras
* **Amostras independentes**: Não
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Não Paramétrico
* **Explicação**: Testa se há mais aumentos ou quedas entre pares.
* **Método/Função Python**: scipy.stats.binom_test(x=,n=,p=)
* **Parâmetro**: x: número de casos; n: total de observações; p: 0.5 para teste de mediana
* **Exemplo**: Comparar número de visitas a médicos entre dois grupos com distribuições assimétricas.

###Teste de Friedman

* **Amostras**: 3 ou mais amostras
* **Amostras independentes**: Não
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Não Paramétrico
* **Explicação**: ANOVA não paramétrica para medidas repetidas. Comparação mediana de amostras dependentes em mais de dois grupos.
* **Método/Função Python**: scipy.stats.friedmanchisquare(*args)
* **Parâmetro**: *args: lista de dados amostrais de diferentes grupos
* **Exemplo**: Avaliar mudanças no humor de pacientes ao longo de 3 semanas de tratamento com sessões de meditação.

### Teste de Kruskal-Wallis

* **Amostras**: 3 ou mais amostras
* **Amostras independentes**: Sim
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Não Paramétrico
* **Explicação**: ANOVA não paramétrica entre 3+ grupos independentes.
* **Método/Função Python**: scipy.stats.kruskal(*args)
* **Parâmetro**: *args: lista de dados amostrais de diferentes grupos
* **Exemplo**: Comparar tempos de internação entre 4 hospitais com dados não normais.

## 📉 Testes para Variância

###Teste de Bartlett

* **Amostras**: 2 amostras
* **Amostras independentes**: Sim
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Paramétrico
* **Explicação**: Testa se variâncias de múltiplas amostras são iguais (assumindo normalidade)
* **Método/Função Python**: scipy.stats.bartlett(*args)
* **Parâmetro**: *args: lista ou arrays de dados amostrais
* **Exemplo**: Verificar se a variabilidade na pressão arterial difere entre pacientes diabéticos e não diabéticos.

###Teste de Levene

* **Amostras**: 2 amostras
* **Amostras independentes**: Sim
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Não Paramétrico
* **Explicação**: Para verificar se variâncias são iguais. Mais robusto, não exige normalidade.
* **Método/Função Python**: scipy.stats.levene(*args)
* **Parâmetro**: *args: lista ou arrays de dados amostrais
* **Exemplo**: Avaliar se a variabilidade do tempo de atendimento ao cliente é igual em 3 unidades de saúde.

## 📉 Testes de Proporção

###Teste z para 1 proporção

* **Amostras**: 1 amostra
* **Amostras independentes**: Não
* **Mais de duas categorias:** Não
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Paramétrico
* **Explicação**: Verifica se a proporção observada em uma amostra é igual a uma proporção esperada da população.
* **Método/Função Python**: statsmodels.stats.proportion.proportions_ztest(count=, nobs=, value=)
* **Parâmetro**: count: sucessos; nobs: tamanho da amosra; value: proporção esperada
* **Exemplo**: Uma clínica acredita que 20% dos pacientes faltam às consultas. Após uma campanha educativa, uma amostra mostra 12% de faltas. O gestor aplica o teste para verificar se essa proporção realmente mudou.

###Teste z para 2 proporções

* **Amostras**: 1 amostra
* **Amostras independentes**: Sim
* **Mais de duas categorias:** Não
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Paramétrico
* **Explicação**: Compara se há diferença significativa entre as proporções de dois grupos independentes.
* **Método/Função Python**: statsmodels.stats.proportion.proportions_ztest(count=, nobs=, value=)
* **Parâmetro**: count: lista de sucesso em cada amostra; nobs: tamanho da amostra
* **Exemplo**: Um hospital testa uma nova vacina. No grupo vacinado, 8% tiveram a doença; no grupo controle, 20%. O teste z para 2 proporções verifica se essa diferença é estatisticamente significativa.

###Teste exato de Fisher

* **Amostras**: 1 amostra (tabela de contingência 2x2)
* **Amostras independentes**: Sim
* **Mais de duas categorias**: Não (apenas para tabelas 2x2)
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Não Paramétrico
* **Explicação**: Avalia se há associação entre duas variáveis categóricas em tabelas pequenas, especialmente quando alguma célula da tabela de contingência tem frequência esperada menor que 5. Fornece a probabilidade exata de obter os dados observados (ou mais extremos), dado que as variáveis são independentes.
* **Método/Função Python**: scipy.stats.fisher_exact(table, alternative='two-sided')
* **Parâmetro**: table: matriz 2x2 com frequências observadas. alternative: 'two-sided', 'less' ou 'greater'
* **Exemplo**: Um pesquisador quer avaliar se há associação entre sexo (M/F) e resultado do teste de triagem (positivo/negativo) em um grupo de 20 pessoas. Como o tamanho da amostra é pequeno e algumas células têm frequência esperada < 5, aplica-se o Teste Exato de Fisher.

###Qui-Quadrado de Aderência

* **Amostras**: 1 amostra
* **Amostras independentes**: Sim
* **Mais de duas categorias:** Sim
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Não Paramétrico
* **Explicação**: Avalia se há associação entre duas variáveis categóricas em uma tabela de contingência.
* **Método/Função Python**: scipy.stats.chisquare(f_obs=, f_exp=)
* **Parâmetro**: f_obs: frequências observadas; f_exp: frequências esperadas
* **Exemplo**: Um pesquisador avalia se o tipo de plano de saúde (público/privado) está associado à adesão ao tratamento (sim/não). Ele constrói uma tabela com as frequências e usa o teste do qui-quadrado.

###Qui-Quadrado

* **Amostras**: 2 amostras
* **Amostras independentes**: Indiferente
* **Mais de duas categorias:** Sim
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Não Paramétrico
* **Explicação**: Compara proporções observadas com proporções esperadas para múltiplas categorias.
* **Método/Função Python**: scipy.stats.chi2_contingency(observed=)
* **Parâmetro**: observed: tabela de contigência com as frequências observadas, gerada a patir de pd.crosstab
* **Exemplo**: Espera-se que 25% dos pacientes sejam classificados em cada um dos quatro níveis de gravidade de uma triagem. Após a triagem de 400 pacientes, o analista usa o teste para verificar se essa distribuição foi respeitada.

### Teste de McNemar

* **Amostras**: 2 ou mais amostras
* **Amostras independentes**: Não
* **Mais de duas categorias:** Não
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Não Paramétrico
* **Explicação**: Verifica se há mudança de proporções entre dois momentos (ou lados) para dados binários pareados.
* **Método/Função Python**: statsmodels.stats.contingency.mcnemar(table=)
* **Parâmetro**: table: tabela de contingência 2x2 com frequências
* **Exemplo**: Em um hospital, 80 pacientes responderam se tinham conhecimento sobre o uso correto de antibióticos antes e depois de uma campanha. O teste de McNemar verifica se houve mudança significativa.

### Teste Q de Cochran

* **Amostras**: 3 ou mais amostras
* **Amostras independentes**: Indiferente
* **Mais de duas categorias:** Sim
* **Desvio padrão populacional conhecido**: Não se aplica
* **Categoria**: Não Paramétrico
* **Explicação**: Extensão do teste de McNemar para 3+ condições pareadas com variáveis binárias.
* **Método/Função Python**: statsmodels.stats.contigency.cochrans_q(data=)
* **Parâmetro**: data: matriz binária (linhas: indivíduos, colunas: grupos)
* **Exemplo**: Em um estudo com 50 pacientes, verifica-se a adesão (sim/não) ao medicamento nas semanas 1, 2 e 3. O teste de Cochran analisa se houve mudança nas proporções ao longo do tempo.