<a href="https://colab.research.google.com/github/leandracarneiro/estatistica/blob/main/medianas_Teste_Wilcoxon.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Teste Wilcoxon - Variáveis dependentes/pareadas (antes e após) - duas medianas**

O teste de Wilcoxon é um teste estatístico não paramétrico que compara duas amostras relacionadas. Ele é usado para verificar se as medianas das amostras são iguais.

**Quando usar o teste de Wilcoxon?**

Quando não se pode assumir que a população é normalmente distribuída

Quando se deseja comparar os mesmos participantes em dois momentos distintos

Quando se deseja comparar participantes distintos, mas emparelhados

**Como aplicar o teste de Wilcoxon?**

Calcular a diferença entre as observações para cada par

Ignorar os sinais das diferenças e atribuir postos a elas

Calcular a soma dos postos (S) de todas as diferenças negativas (ou positivas)

Calcular o valor p para determinar se há evidências suficientes para rejeitar a hipótese nula

**Quando rejeitar a hipótese nula?**

Se o valor p for menor que o nível de significância pré-definido (geralmente 0,05), então a hipótese nula é rejeitada.

O teste de Wilcoxon foi desenvolvido por F. Wilcoxon em 1945

A mediana da idade gestacional informada pelo obstetra é a mesma da informada pelo pediatra?

In [None]:
# importar as bibliotecas
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import scipy.stats as stats
import statsmodels.stats.multicomp as stsmodels

In [None]:
# caso a biblioteca scipy não esteja no servidor da Google, instalar ela com o comando !pip (somente se der algum erro no bloco de cima)
# !pip install scipy

In [None]:
# instalar no servidor uma biblioteca específica pra usar o teste de DUNN
!pip install scikit-posthocs

In [None]:
# importando a bilioteca
import scikit_posthocs as sp

In [None]:
# Endereço do arquivo com a base de dados
arquivo = 'url do seu bancode dados '

# Ler o arquivo - sem a primeira coluna
dados = pd.read_excel(arquivo)
dados.info()

In [None]:
# Selecionar os nomes das variáveis  (coluna1, coluna2)

# Filtrar registros que sem nulos nas duas colunas
dados2 = dados.dropna(how = 'any', subset=['coluna1', 'coluna2'])

# Separar os dois grupos pela categoria, e selecionar só a coluna numérica desejada
grupo1 = dados2.coluna1
grupo2 = dados2.coluna2

In [None]:
# 1ª ETAPA - Estatística descritiva

# Estatística descritiva - Análise dos valores medianos
medianG1 = grupo1.median()
medianG2 = grupo2.median()

print(f'Mediana do Grupo 1: {medianG1:.1f}')
print(f'Mediana do Grupo 2: {medianG2:.1f}')
print()

# mediaG1 = grupo1.mean()
# mediaG2 = grupo2.mean()
# print(f'Media do Grupo 1: {mediaG1:.10f}')
# print(f'Media do Grupo 2: {mediaG2:.10f}')
# print()

# _______________________________________________________________________________________
# 2º ETAPA - realizar o teste de medianas para VARIÁVEIS DEPENDENTES / PAREADAS / (antes e após)

# Teste de Wilcoxon para variáveis pareadas (antes e após)
# H0 = as medianas são iguais

resultado = stats.wilcoxon(grupo1, grupo2)
print('Teste de Wilcoxon - 2 medianas pareadas')
print(f'p-value: {resultado.pvalue:.3f}')

# interpretação
if resultado.pvalue <= 0.05:
    print('Rejeita H0 => As medianas são diferentes!')
else:
    print('Aceita H0 => As medianas são iguais!')

# _______________________________________________________________________________________
print()
# Estatística descritiva - Análise Gráfica -> Mostrar 2 histogramas

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 4))
sns.histplot(grupo1, ax=ax1, binwidth=1)
sns.histplot(grupo2, ax=ax2, binwidth=1)
plt.tight_layout()

Saiba mais: https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.wilcoxon.html#scipy.stats.wilcoxon