## Importações

In [None]:
import pandas as pd
import numpy as np
from scipy.stats import shapiro #Teste de normalidade
from scipy.stats import ttest_ind #Teste t de Student
from scipy.stats import wilcoxon #Teste de Wilcoxon
from numpy import std, mean, sqrt #Para o teste de Cohen

## Data Frame (df)

In [None]:
df = pd.read_csv('https://raw.githubusercontent.com/leprogramar/obsidian/master/Dissertacao-versoes/Dissertacao-versao-6/dados-filtrados-2.csv') # Esse Dataframe está hospedado no GitHub. Caso nao não carregue, procure pelo link.
#df = df.describe()
#pd.set_option('display.max_columns', None)
#df

# Teste automatizado de **Shapiro-Wilk** para todas as as variáveis

In [None]:
numeric_df = df.select_dtypes(include=['number']) # Filtrando para o spript pegar apenas dados numéricos
results = {}
for column in numeric_df.columns:
    stat, p = shapiro(numeric_df[column].dropna())  # Remover valores NaN antes do teste (o teste de shapiro dá erro se tiver Nan)
    results[column] = {'Statistic': stat, 'p_value': p}  # Armazenando os resultados em um dicionário
results_df = pd.DataFrame(results).T  # Convertendo o dicionário para um DataFrame
results_df['Teste de normalidade'] = results_df['p_value'].apply(lambda p: 'Normal' if p > 0.05 else 'Não normal') # Classificando o valor de p
results_df.to_csv('shapiro_results.csv', index=True)
print(results_df)

                            Statistic   p_value Teste de normalidade
tempo-50m-cap-aquec          0.770920  0.006417           Não normal
tempo-50m-plac-aquec         0.761119  0.004875           Não normal
tempo-50m-cap-nnaquec        0.786787  0.010014           Não normal
tempo-50m-plac-nnaquec       0.800984  0.014903           Não normal
tempo-15m-cap-aquec          0.691617  0.000697           Não normal
tempo-15m-plac-aquec         0.706765  0.001064           Não normal
tempo-15m-cap-nnaquec        0.755062  0.004113           Não normal
tempo-15m-plac-nnaquec       0.765936  0.005580           Não normal
tempo-35m-cap-aquec          0.726346  0.001839           Não normal
tempo-35m-plac-aquec         0.803666  0.016064           Não normal
tempo-35m-cap-nnaquec        0.742681  0.002907           Não normal
tempo-35m-plac-nnaquec       0.719463  0.001517           Não normal
lac-pre-cap-aquec            0.931671  0.464532               Normal
lac-pre-plac-aquec           0.941

## Dicionário de variáveis

In [None]:
# Dicionário de variáveis:

calculos_test_t = {
    #Tempo 50 metros
    "tempo-50m-cap_VS_plc_aquec": {
        "colun1": "tempo-50m-cap-aquec",
        "colun2": "tempo-50m-plac-aquec"
    },
    "tempo-50m-cap_VS_plc_nnaquec": {
        "colun1": "tempo-50m-cap-nnaquec",
        "colun2": "tempo-50m-plac-nnaquec"
    },
    "tempo-50m-cap_aquec_VS_cap_nnaquec": {
        "colun1": "tempo-50m-cap-nnaquec",
        "colun2": "tempo-50m-cap-aquec"
    },
    "tempo-50m-plc_aquec_VS_plc_nnaquec": {
        "colun1": "tempo-50m-plac-nnaquec",
        "colun2": "tempo-50m-plac-aquec"
    },

    #Tempo 15 metros
        "tempo-15m-cap_VS_plc_aquec": {
        "colun1": "tempo-15m-cap-aquec",
        "colun2": "tempo-15m-plac-aquec"
    },
    "tempo-15m-cap_VS_plc_nnaquec": {
        "colun1": "tempo-15m-cap-nnaquec",
        "colun2": "tempo-15m-plac-nnaquec"
    },
    "tempo-15m-cap_aquec_VS_cap_nnaquec": {
        "colun1": "tempo-15m-cap-nnaquec",
        "colun2": "tempo-15m-cap-aquec"
    },
    "tempo-15m-plc_aquec_VS_plc_nnaquec": {
        "colun1": "tempo-15m-plac-nnaquec",
        "colun2": "tempo-15m-plac-aquec"
    },


    #Tempo 35 metros
    "tempo-35m-cap_aquec_VS_plc_aquec": {
        "colun1": "tempo-35m-cap-aquec",
        "colun2": "tempo-35m-plac-aquec"
    },
    "tempo-35m-cap_nnaquec_VS_plc_nnaquec": {
        "colun1": "tempo-35m-cap-nnaquec",
        "colun2": "tempo-35m-plac-nnaquec"
    },
    "tempo-35m-cap_aquec_VS_cap_nnaquec": {
        "colun1": "tempo-35m-cap-nnaquec",
        "colun2": "tempo-35m-cap-aquec"
    },
    "tempo-35m-plc_aquec_VS_plc_nnaquec": {
        "colun1": "tempo-35m-plac-nnaquec",
        "colun2": "tempo-35m-plac-aquec"
    },

    #Lactato pré
    "lactato-pre-cap_VS_plc_aquec": {
        "colun1": "lac-pre-cap-aquec",
        "colun2": "lac-pre-plac-aquec"
    },
    "lactato-pre-cap_VS_plc_nnaquec": {
        "colun1": "lac-pre-cap-nnaquec",
        "colun2": "lac-pre-plac-nnaquec"
    },
    "lactato-pre-cap_aquec_VS_cap_nnaquec": {
        "colun1": "lac-pre-cap-nnaquec",
        "colun2": "lac-pre-cap-aquec"
    },
    "lactato-pre-plc_aquec_VS_plc_nnaquec": {
        "colun1": "lac-pre-plac-nnaquec",
        "colun2": "lac-pre-plac-aquec"
    },
    #Lactato pós 1 min
    "lactato-pos_1min_cap_VS_plc_aquec": {
        "colun1": "lac-pos-1min-cap-aquec",
        "colun2": "lac-pos-1min-plac-aquec"
    },
    "lactato-pos_1min_cap_VS_plc_nnaquec": {
        "colun1": "lac-pos-1min-cap-nnaquec",
        "colun2": "lac-pos-1min-plac-nnaquec"
    },
    "lactato-pos_1min_cap_aquec_VS_cap_nnaquec": {
        "colun1": "lac-pos-1min-cap-nnaquec",
        "colun2": "lac-pos-1min-cap-aquec"
    },
    "lactato-pos_1min_plc_aquec_VS_plc_nnaquec": {
        "colun1": "lac-pos-1min-plac-nnaquec",
        "colun2": "lac-pos-1min-plac-aquec"
    },

    #Lactato pos 3 min
        "lactato-pos_3min_cap_VS_plc_aquec": {
        "colun1": "lac-pos-3min-cap-aquec",
        "colun2": "lac-pos-3min-plac-aquec"
    },
    "lactato-pos_3min_cap_VS_plc_nnaquec": {
        "colun1": "lac-pos-3min-cap-nnaquec",
        "colun2": "lac-pos-3min-plac-nnaquec"
    },
    "lactato-pos_3min_cap_aquec_VS_cap_nnaquec": {
        "colun1": "lac-pos-3min-cap-nnaquec",
        "colun2": "lac-pos-3min-cap-aquec"
    },
    "lactato-pos_3min_plc_aquec_VS_plc_nnaquec": {
        "colun1": "lac-pos-3min-plac-nnaquec",
        "colun2": "lac-pos-3min-plac-aquec"
    },

    #SCM
    "scm-cap_VS_plc_aquec": {
        "colun1": "media-salto-cap-aquec",
        "colun2": "media-salto-plac-aquec"
    },
    "scm-cap_VS_plc_nnaquec": {
        "colun1": "media-salto-cap-nnaquec",
        "colun2": "media-salto-plac-nnaquec"
    },
    "scm-cap_aquec_VS_cap_nnaquec": {
        "colun1": "media-salto-cap-aquec",
        "colun2": "media-salto-cap-nnaquec"
    },
    "scm-plc_aquec_VS_plc_nnaquec": {
        "colun1": "media-salto-plac-aquec",
        "colun2": "media-salto-plac-nnaquec"
    },

    #pse
    "pse-cap_VS_plc_aquec": {
        "colun1": "pse-cap-aquec",
        "colun2": "pse-plac-aquec"
    },
    "pse-cap_VS_plc_nnaquec": {
        "colun1": "pse-cap-nnaquec",
        "colun2": "pse-plac-nnaquec"
    },
    "pse-cap_aquec_VS_cap_nnaquec": {
        "colun1": "pse-cap-nnaquec",
        "colun2": "pse-cap-aquec"
    },
    "pse-plc_aquec_VS_plc_nnaquec": {
        "colun1": "pse-plac-nnaquec",
        "colun2": "pse-plac-aquec"
    },

    #motivacao
    "motivacao-cap_VS_plc_aquec": {
        "colun1": "motivacao-cap-aquec",
        "colun2": "motivacao-plac-aquec"
    },
    "motivacao-cap_VS_plc_nnaquec": {
        "colun1": "motivacao-cap-nnaquec",
        "colun2": "motivacao-plac-nnaquec"
    },
    "motivacao-cap_aquec_VS_cap_nnaquec": {
        "colun1": "motivacao-cap-nnaquec",
        "colun2": "motivacao-cap-aquec"
    },
    "motivacao-plc_aquec_VS_plc_nnaquec": {
        "colun1": "motivacao-plac-nnaquec",
        "colun2": "motivacao-plac-aquec"
    },

    #preparacao
    "preparacao-cap_VS_plc_aquec": {
        "colun1": "preparacao-cap-aquec",
        "colun2": "preparacao-plac-aquec"
    },
    "preparacao-cap_VS_plc_nnaquec": {
        "colun1": "preparacao-cap-nnaquec",
        "colun2": "preparacao-plac-nnaquec"
    },
    "preparacao-cap_aquec_VS_cap_nnaquec": {
        "colun1": "preparacao-cap-nnaquec",
        "colun2": "preparacao-cap-aquec"
    },
    "preparacao-plc_aquec_VS_plc_nnaquec": {
        "colun1": "preparacao-plac-nnaquec",
        "colun2": "preparacao-plac-aquec"
    },

    #brums_fadiga
    "brums_fadiga-cap_VS_plc_aquec": {
        "colun1": "brums-fadiga-cap-aquec",
        "colun2": "brums-fadiga-plac-aquec"
    },
    "brums_fadiga-cap_VS_plc_nnaquec": {
        "colun1": "brums-fadiga-cap-nnaquec",
        "colun2": "brums-fadiga-plac-nnaquec"
    },
    "brums_fadiga-cap_aquec_VS_cap_nnaquec": {
        "colun1": "brums-fadiga-cap-nnaquec",
        "colun2": "brums-fadiga-cap-aquec"
    },
    "brums_fadiga-plc_aquec_VS_plc_nnaquec": {
        "colun1": "brums-fadiga-plac-nnaquec",
        "colun2": "brums-fadiga-plac-aquec"
    },


    #brums-vigor
    "brums-vigor-cap_VS_plc_aquec": {
        "colun1": "brums-vigor-cap-aquec",
        "colun2": "brums-vigor-plac-aquec"
    },
    "brums-vigor-cap_VS_plc_nnaquec": {
        "colun1": "brums-vigor-cap-nnaquec",
        "colun2": "brums-vigor-plac-nnaquec"
    },
    "brums-vigor-cap_aquec_VS_cap_nnaquec": {
        "colun1": "brums-vigor-cap-nnaquec",
        "colun2": "brums-vigor-cap-aquec"
    },
    "brums-vigor-plc_aquec_VS_plc_nnaquec": {
        "colun1": "brums-vigor-plac-nnaquec",
        "colun2": "brums-vigor-plac-aquec"
        }
}

### **Teste de Hipótese**

1. Para variáveis com distribuição normal, foi realizado o teste **t de Student**.
2. Para variáveis com distribuição não normal, foi adotado o teste **de Wilcoxon**.
3. Para todos os testes, a hipótese nula (H0) foi rejeitada se \( p < 0,05 \).

## **Teste-t de Sudent** automatizado

In [None]:
#Automatização do teste t restornando um DataFrame:

resultados = []

def test_t(colun1, colun2):
    values1 = df[colun1]
    values2 = df[colun2]
    stat, p = ttest_ind(values1.dropna(), values2.dropna())  # Remover valores NaN antes do teste
    classification = 'Diferença Significativa' if p < 0.05 else 'Diferença Não Significativa'


    resultado = { # Armazena os resultados em um dicionário
        'Coluna 1': colun1,
        'Coluna 2': colun2,
        'T-statistic': stat,
        'P-value': p,
        'Classificação': classification
    }

    resultados.append(resultado)  # Adiciona o dicionário à lista de resultados

for k, v in calculos_test_t.items(): # Executa os testes t e armazena os resultados
    colun1 = v["colun1"]
    colun2 = v["colun2"]
    test_t(colun1, colun2)


df_resultados = pd.DataFrame(resultados) # Converte a lista de resultados em um DataFrame

df_resultados.to_csv('teste_t_resultado.csv', index=True) # Salva o DataFrame em um arquivo CSV

print(df_resultados) # Exibe o DataFrame

                     Coluna 1                   Coluna 2  T-statistic  \
0         tempo-50m-cap-aquec       tempo-50m-plac-aquec    -0.006540   
1       tempo-50m-cap-nnaquec     tempo-50m-plac-nnaquec     0.088772   
2       tempo-50m-cap-nnaquec        tempo-50m-cap-aquec     0.133856   
3      tempo-50m-plac-nnaquec       tempo-50m-plac-aquec     0.040215   
4         tempo-15m-cap-aquec       tempo-15m-plac-aquec    -0.059031   
5       tempo-15m-cap-nnaquec     tempo-15m-plac-nnaquec    -0.057975   
6       tempo-15m-cap-nnaquec        tempo-15m-cap-aquec    -0.206142   
7      tempo-15m-plac-nnaquec       tempo-15m-plac-aquec    -0.225245   
8         tempo-35m-cap-aquec       tempo-35m-plac-aquec     0.141458   
9       tempo-35m-cap-nnaquec     tempo-35m-plac-nnaquec     0.117813   
10      tempo-35m-cap-nnaquec        tempo-35m-cap-aquec     0.105761   
11     tempo-35m-plac-nnaquec       tempo-35m-plac-aquec     0.117098   
12          lac-pre-cap-aquec         lac-pre-plac-

## Teste de **Wilcoxon** automatizado

In [None]:
# Teste de Wilcoxon automatizado gerarando DataFrame

resultados = []
def wilcoxon_test(colun1, colun2):
    values1 = df[colun1]
    values2 = df[colun2]
    res = wilcoxon(values1.dropna(), values2.dropna())  # Remove valores NaN antes do teste
    if res.pvalue < 0.05:
        classification = 'Diferença Significativa'
    else:
        classification = 'Diferença Não Significativa'

    resultado = { # Armazena os resultados em um dicionário
        'Coluna 1': colun1,
        'Coluna 2': colun2,
        'Estatística W': res.statistic,
        'P-value': res.pvalue,
        'Classificação': classification
    }

    resultados.append(resultado)  # Adiciona o dicionário à lista de resultados

for k, v in calculos_test_t.items():
    print(k)
    colun1 = v["colun1"]
    colun2 = v["colun2"]
    wilcoxon_test(colun1, colun2)


df_resultados = pd.DataFrame(resultados) # Converte a lista de resultados em um DataFrame

df_resultados.to_csv('wilcoxon_test_resultado.csv', index=True) # Salva o DataFrame em um arquivo CSV

print(df_resultados) # Exibe o DataFrame

tempo-50m-cap_VS_plc_aquec
tempo-50m-cap_VS_plc_nnaquec
tempo-50m-cap_aquec_VS_cap_nnaquec
tempo-50m-plc_aquec_VS_plc_nnaquec
tempo-15m-cap_VS_plc_aquec
tempo-15m-cap_VS_plc_nnaquec
tempo-15m-cap_aquec_VS_cap_nnaquec
tempo-15m-plc_aquec_VS_plc_nnaquec
tempo-35m-cap_aquec_VS_plc_aquec
tempo-35m-cap_nnaquec_VS_plc_nnaquec
tempo-35m-cap_aquec_VS_cap_nnaquec
tempo-35m-plc_aquec_VS_plc_nnaquec
lactato-pre-cap_VS_plc_aquec
lactato-pre-cap_VS_plc_nnaquec
lactato-pre-cap_aquec_VS_cap_nnaquec
lactato-pre-plc_aquec_VS_plc_nnaquec
lactato-pos_1min_cap_VS_plc_aquec
lactato-pos_1min_cap_VS_plc_nnaquec
lactato-pos_1min_cap_aquec_VS_cap_nnaquec
lactato-pos_1min_plc_aquec_VS_plc_nnaquec
lactato-pos_3min_cap_VS_plc_aquec
lactato-pos_3min_cap_VS_plc_nnaquec
lactato-pos_3min_cap_aquec_VS_cap_nnaquec
lactato-pos_3min_plc_aquec_VS_plc_nnaquec
scm-cap_VS_plc_aquec
scm-cap_VS_plc_nnaquec
scm-cap_aquec_VS_cap_nnaquec
scm-plc_aquec_VS_plc_nnaquec
pse-cap_VS_plc_aquec
pse-cap_VS_plc_nnaquec
pse-cap_aquec_VS_cap



## Teste D de Cohen para todas as variáveis

In [None]:
# Teste d de Cohen

import pandas as pd
def cohen_d(x,y):
  nx = len(x)
  ny = len(y)
  dof = nx + ny - 2
  return (mean(x) - mean(y)) / sqrt(((nx-1)*std(x, ddof=1) ** 2 + (ny-1)*std(y, ddof=1) ** 2) / dof)

resultados_d_cohen = []
for k, v in calculos_test_t.items():
  coluna1 = v["colun1"]
  coluna2 = v["colun2"]
  valores1 = df[coluna1].dropna()
  valores2 = df[coluna2].dropna()
  d = cohen_d(valores1, valores2)
  tamanho_efeito = ''
  if abs(d) < 0.2:
    tamanho_efeito = 'Pequeno'
  elif abs(d) < 0.5:
    tamanho_efeito = 'Médio'
  else:
    tamanho_efeito = 'Grande'

  resultados_d_cohen.append({
      'Comparação': k,
      'Cohen\'s d': d,
      'Tamanho do Efeito': tamanho_efeito
  })

df_resultados_d_cohen = pd.DataFrame(resultados_d_cohen)
print(df_resultados_d_cohen)


                                   Comparação  Cohen's d Tamanho do Efeito
0                  tempo-50m-cap_VS_plc_aquec  -0.002925           Pequeno
1                tempo-50m-cap_VS_plc_nnaquec   0.039700           Pequeno
2          tempo-50m-cap_aquec_VS_cap_nnaquec   0.059862           Pequeno
3          tempo-50m-plc_aquec_VS_plc_nnaquec   0.017985           Pequeno
4                  tempo-15m-cap_VS_plc_aquec  -0.026400           Pequeno
5                tempo-15m-cap_VS_plc_nnaquec  -0.025927           Pequeno
6          tempo-15m-cap_aquec_VS_cap_nnaquec  -0.092189           Pequeno
7          tempo-15m-plc_aquec_VS_plc_nnaquec  -0.100732           Pequeno
8            tempo-35m-cap_aquec_VS_plc_aquec   0.063262           Pequeno
9        tempo-35m-cap_nnaquec_VS_plc_nnaquec   0.052688           Pequeno
10         tempo-35m-cap_aquec_VS_cap_nnaquec   0.047298           Pequeno
11         tempo-35m-plc_aquec_VS_plc_nnaquec   0.052368           Pequeno
12               lactato-