#üß† O que s√£o?

* Testes param√©tricos (como t, F, ANOVA) assumem que os dados seguem uma distribui√ß√£o conhecida, geralmente a normal.

* Testes n√£o-param√©tricos s√£o alternativas robustas que n√£o exigem essa suposi√ß√£o.

# üèõÔ∏è Motiva√ß√£o

* Dados assim√©tricos,
* Presen√ßa de outliers,
* Distribui√ß√µes desconhecidas,
* Vari√°veis ordinais (ex: grau de dor: leve, moderada, intensa),
* Amostras pequenas sem garantia de normalidade.

**Exemplo sal√°rio**

In [2]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy.stats import ttest_ind, mannwhitneyu

In [3]:
# Simular dois grupos de sal√°rios
np.random.seed(42)
n = 100

In [4]:
# Grupo A: distribui√ß√£o de sal√°rios com assimetria e outliers (mediana = 3000)
salarios_a = np.concatenate([np.random.normal(3000, 500, n), np.array([20000, 25000])])  # outliers

# Grupo B: semelhante, mas com m√©dia um pouco maior
salarios_b = np.concatenate([np.random.normal(3300, 500, n), np.array([21000, 26000])])

# Organizar DataFrame
df_salarios = pd.DataFrame({
    "salario": np.concatenate([salarios_a, salarios_b]),
    "grupo": ["A"] * len(salarios_a) + ["B"] * len(salarios_b)
})

In [5]:
df_salarios

Unnamed: 0,salario,grupo
0,3248.357077,A
1,2930.867849,A
2,3323.844269,A
3,3761.514928,A
4,2882.923313,A
...,...,...
199,3376.862553,B
200,3329.104359,B
201,2728.514851,B
202,21000.000000,B


In [6]:
# Calcular estat√≠sticas
media_a, mediana_a = np.mean(salarios_a), np.median(salarios_a)
media_b, mediana_b = np.mean(salarios_b), np.median(salarios_b)

In [11]:
# Mostrar tabela de resultados
comparacao = pd.DataFrame({
    "Grupo": ["A", "B"],
    "M√©dia": [media_a, media_b],
    "Mediana": [mediana_a, mediana_b]
}).round(2)

In [12]:
comparacao

Unnamed: 0,Grupo,M√©dia,Mediana
0,A,3331.45,2953.09
1,B,3707.01,3363.34


In [10]:
# Aplicar testes
t_stat, t_p = ttest_ind(salarios_a, salarios_b)
mw_stat, mw_p = mannwhitneyu(salarios_a, salarios_b)

In [13]:
resultados_teste = pd.DataFrame({
    "Teste": ["t-test", "Mann-Whitney U"],
    "Estat√≠stica": [t_stat, mw_stat],
    "p-valor": [t_p, mw_p]
}).round(4)

In [14]:
resultados_teste

Unnamed: 0,Teste,Estat√≠stica,p-valor
0,t-test,-0.9481,0.3442
1,Mann-Whitney U,3195.0,0.0


‚úÖ t-test (param√©trico): Compara√ß√£o de m√©dias assumindo distribui√ß√µes normais.
* Resultado: p = 0.3442 ‚Üí n√£o rejeita H‚ÇÄ.
* Conclus√£o: segundo o teste t, as m√©dias dos sal√°rios n√£o s√£o diferentes.
* Isso acontece porque: O teste t √© sens√≠vel √† m√©dia, e os outliers do Grupo B aumentaram a m√©dia, mas com alta variabilidade, o teste n√£o detecta diferen√ßa estat√≠stica.

‚úÖ Mann-Whitney U (n√£o param√©trico): Compara√ß√£o das distribui√ß√µes com base em ranks, mais robusto a outliers.
* Resultado: p < 0.001 ‚Üí rejeita H‚ÇÄ.
* Conclus√£o: segundo o teste Mann-Whitney, h√° uma diferen√ßa significativa entre os grupos.
* Isso acontece porque: O teste avalia a mediana e distribui√ß√£o geral, e o Grupo B, mesmo com mediana pr√≥xima, apresenta uma distribui√ß√£o assim√©trica e dispersa, que afeta a compara√ß√£o de rankings.

# üîÑ Compara√ß√£o com testes param√©tricos

| Aspecto               | Param√©trico               | N√£o Param√©trico                        |
| --------------------- | ------------------------- | -------------------------------------- |
| Sup√µe normalidade     | Sim                       | N√£o                                    |
| Mede                  | M√©dia                     | Mediana ou ranking                     |
| Resistente a outliers | N√£o                       | Sim                                    |
| Uso comum             | Dados cont√≠nuos e normais | Ordinais, assim√©tricos, pequenos       |
| Exemplo t√≠pico        | t-test, ANOVA             | Mann-Whitney, Wilcoxon, Kruskal-Wallis |


# üß™ Testes equivalentes

| Finalidade                   | Param√©trico     | N√£o Param√©trico            |
| ---------------------------- | --------------- | -------------------------- |
| 2 grupos independentes       | t-test          | Mann-Whitney U             |
| 2 grupos dependentes         | t pareado       | Wilcoxon                   |
| 3+ grupos independentes      | ANOVA           | Kruskal-Wallis             |
| 3+ grupos dependentes        | ANOVA Repetidas | Friedman                   |
| Propor√ß√µes (bin√°rio pareado) | Qui-quadrado    | Teste de sinais / Binomial |


# üü¢ Vantagens dos Testes N√£o-Param√©tricos

* Avaliam a mediana ‚Üí mais resistente a assimetrias.
* Funcionam com dados ordinais.
* S√£o √∫teis quando: A amostra √© pequena, A distribui√ß√£o √© desconhecida ou distorcida, H√° outliers leg√≠timos que voc√™ n√£o quer remover.

# üìå Cuidados

Testes n√£o-param√©tricos t√™m menor poder estat√≠stico quando os dados s√£o normais.

# üí° Quando usar?

Use um teste n√£o param√©trico quando:

* Voc√™ n√£o pode garantir a normalidade,
* Os dados s√£o ordinais,
* H√° outliers que refletem a realidade do fen√¥meno estudado,
* A amostra √© pequena.