In [1]:
import pandas as pd
from scipy.stats import shapiro, ttest_ind, mannwhitneyu, levene

In [2]:
# Carregar os dados
nome_arquivo = 'resultados_inferencia_total_sem_VGG.csv'
dados = pd.read_csv(nome_arquivo, sep=';', encoding='utf-8')

# Converter colunas de string para float
colunas = ['Acurácia Teste', 'Precisão Teste', 'Recall Teste', 'F1 Score Teste', 'Tempo Teste', 'Emissões Teste']
for coluna in colunas:
    dados[coluna] = dados[coluna].str.replace(',', '.').astype(float)

# Separar os grupos
grupo_fp32 = dados[dados['Precisão numérica'] == 'FP32']
grupo_fp16 = dados[dados['Precisão numérica'] == 'FP16']

# Testes estatísticos
resultados = []
for coluna in colunas:
    # Teste de normalidade
    stat_fp32, p_fp32 = shapiro(grupo_fp32[coluna])
    stat_fp16, p_fp16 = shapiro(grupo_fp16[coluna])
    normal_fp32 = p_fp32 > 0.05
    normal_fp16 = p_fp16 > 0.05

    # Teste de homocedasticidade
    stat_homocedasticidade, p_homocedasticidade = levene(grupo_fp32[coluna], grupo_fp16[coluna])
    homocedasticidade = p_homocedasticidade > 0.05

    # Escolha do teste
    if normal_fp32 and normal_fp16:
        stat, p_valor = ttest_ind(grupo_fp32[coluna], grupo_fp16[coluna], equal_var=homocedasticidade)
        if homocedasticidade:
            teste = 't-test'
        else:
            teste = 'Welch’s t-test'
    else:
        stat, p_valor = mannwhitneyu(grupo_fp32[coluna], grupo_fp16[coluna], alternative='two-sided')
        teste = 'Mann-Whitney'

    resultados.append({
        'Métrica': coluna,
        'Normal FP32': normal_fp32,
        'Normal FP16': normal_fp16,
        'levene (homocedasticidade)': homocedasticidade,
        'p-valor': p_valor,
        'Teste': teste,
    })

# Exibir resultados
df_resultados = pd.DataFrame(resultados)
display(df_resultados)

df_resultados['Normal FP32'] = df_resultados['Normal FP32'].replace({True: 'Sim', False: 'Não'})
df_resultados['Normal FP16'] = df_resultados['Normal FP16'].replace({True: 'Sim', False: 'Não'})
df_resultados['Significativo 5%'] = df_resultados['p-valor'] < 0.05
df_resultados['Significativo 5%'] = df_resultados['Significativo 5%'].replace({True: 'Sim', False: 'Não'})
df_resultados['Significativo 6%'] = df_resultados['p-valor'] < 0.06
df_resultados['Significativo 6%'] = df_resultados['Significativo 6%'].replace({True: 'Sim', False: 'Não'})

# Salvar resultados em um arquivo excel
df_resultados.to_excel('resultados_testes_estatisticos_resultados_TESTE_sem_VGG.xlsx', index=False)

Unnamed: 0,Métrica,Normal FP32,Normal FP16,levene (homocedasticidade),p-valor,Teste
0,Acurácia Teste,False,False,True,0.732645,Mann-Whitney
1,Precisão Teste,False,False,True,0.783899,Mann-Whitney
2,Recall Teste,False,False,True,0.732645,Mann-Whitney
3,F1 Score Teste,False,False,True,0.747185,Mann-Whitney
4,Tempo Teste,False,False,True,0.024649,Mann-Whitney
5,Emissões Teste,False,False,True,0.095017,Mann-Whitney


In [4]:
# Carregar os dados
nome_arquivo = 'emissoes_treino_total_sem_VGG.csv'
dados = pd.read_csv(nome_arquivo, sep=';', encoding='utf-8')

# Converter colunas de string para float
# colunas = [
#     'duration', 'emissions', 'emissions_rate', 'cpu_power', 'gpu_power',
#     'cpu_energy', 'gpu_energy', 'ram_energy', 'energy_consumed', 'carbono_g',
#     'consumo_energia_wh', 'energia_W',
# ]

colunas = ['duration', 'carbono_g', 'emissions', 'emissions_rate', 
           'cpu_power', 'gpu_power', 'cpu_energy', 'gpu_energy', 
           'ram_energy', 'energy_consumed', 'energia_consumida_wh',
           'energia_W']

for coluna in colunas:
    dados[coluna] = dados[coluna].str.replace(',', '.').astype(float)

# Separar os grupos
grupo_fp32 = dados[dados['Precisão'] == 'FP32']
grupo_fp16 = dados[dados['Precisão'] == 'FP16']

# Testes estatísticos
resultados = []
for coluna in colunas:
    # Teste de normalidade
    stat_fp32, p_fp32 = shapiro(grupo_fp32[coluna])
    stat_fp16, p_fp16 = shapiro(grupo_fp16[coluna])
    normal_fp32 = p_fp32 > 0.05
    normal_fp16 = p_fp16 > 0.05

    # Teste de homocedasticidade
    stat_homocedasticidade, p_homocedasticidade = levene(grupo_fp32[coluna], grupo_fp16[coluna])
    homocedasticidade = p_homocedasticidade > 0.05

    # Escolha do teste
    if normal_fp32 and normal_fp16:
        stat, p_valor = ttest_ind(grupo_fp32[coluna], grupo_fp16[coluna], equal_var=homocedasticidade)
        if homocedasticidade:
            teste = 't-test'
        else:
            teste = 'Welch’s t-test'
    else:
        stat, p_valor = mannwhitneyu(grupo_fp32[coluna], grupo_fp16[coluna], alternative='two-sided')
        teste = 'Mann-Whitney'

    resultados.append({
        'Métrica': coluna,
        'Normal FP32': normal_fp32,
        'Normal FP16': normal_fp16,
        'levene (homocedasticidade)': homocedasticidade,
        'p-valor': p_valor,
        'Teste': teste,
    })

# Exibir resultados
df_resultados = pd.DataFrame(resultados)
display(df_resultados)

df_resultados['Normal FP32'] = df_resultados['Normal FP32'].replace({True: 'Sim', False: 'Não'})
df_resultados['Normal FP16'] = df_resultados['Normal FP16'].replace({True: 'Sim', False: 'Não'})
df_resultados['Significativo 5%'] = df_resultados['p-valor'] < 0.05
df_resultados['Significativo 5%'] = df_resultados['Significativo 5%'].replace({True: 'Sim', False: 'Não'})
df_resultados['Significativo 6%'] = df_resultados['p-valor'] < 0.06
df_resultados['Significativo 6%'] = df_resultados['Significativo 6%'].replace({True: 'Sim', False: 'Não'})

# Salvar resultados em um arquivo excel
df_resultados.to_excel('resultados_hipoteses_emissoes_TREINO_sem_VGG.xlsx', index=False)

Unnamed: 0,Métrica,Normal FP32,Normal FP16,levene (homocedasticidade),p-valor,Teste
0,duration,False,False,True,0.063978,Mann-Whitney
1,carbono_g,False,False,True,0.266397,Mann-Whitney
2,emissions,False,False,True,0.266397,Mann-Whitney
3,emissions_rate,False,True,True,0.432725,Mann-Whitney
4,cpu_power,False,False,True,0.000391,Mann-Whitney
5,gpu_power,True,True,True,0.290789,t-test
6,cpu_energy,False,False,True,0.410665,Mann-Whitney
7,gpu_energy,False,False,True,0.266397,Mann-Whitney
8,ram_energy,False,False,True,0.063978,Mann-Whitney
9,energy_consumed,False,False,True,0.266397,Mann-Whitney


In [None]:
# Carregar os dados
nome_arquivo = 'emissoes_treino_total_sem_VGG.csv'
dados = pd.read_csv(nome_arquivo, sep=';', encoding='utf-8')

# Converter colunas de string para float
colunas = [
    'duration', 'emissions', 'emissions_rate', 'cpu_power', 'gpu_power',
    'cpu_energy', 'gpu_energy', 'ram_energy', 'energy_consumed'
]

for coluna in colunas:
    dados[coluna] = dados[coluna].str.replace(',', '.').astype(float)

# Separar os grupos
grupo_fp32 = dados[dados['Precisão'] == 'FP32']
grupo_fp16 = dados[dados['Precisão'] == 'FP16']

# Testes estatísticos
resultados = []
for coluna in colunas:
    # Teste de normalidade
    stat_fp32, p_fp32 = shapiro(grupo_fp32[coluna])
    stat_fp16, p_fp16 = shapiro(grupo_fp16[coluna])
    normal_fp32 = p_fp32 > 0.05
    normal_fp16 = p_fp16 > 0.05

    # Teste de homocedasticidade
    stat_homocedasticidade, p_homocedasticidade = levene(grupo_fp32[coluna], grupo_fp16[coluna])
    homocedasticidade = p_homocedasticidade > 0.05

    # Escolha do teste
    if normal_fp32 and normal_fp16:
        stat, p_valor = ttest_ind(grupo_fp32[coluna], grupo_fp16[coluna], equal_var=homocedasticidade)
        if homocedasticidade:
            teste = 't-test'
        else:
            teste = 'Welch’s t-test'
    else:
        stat, p_valor = mannwhitneyu(grupo_fp32[coluna], grupo_fp16[coluna], alternative='two-sided')
        teste = 'Mann-Whitney'

    resultados.append({
        'Métrica': coluna,
        'Normal FP32': normal_fp32,
        'Normal FP16': normal_fp16,
        'levene (homocedasticidade)': homocedasticidade,
        'p-valor': p_valor,
        'Teste': teste,
    })

# Exibir resultados
df_resultados = pd.DataFrame(resultados)
display(df_resultados)

df_resultados['Normal FP32'] = df_resultados['Normal FP32'].replace({True: 'Sim', False: 'Não'})
df_resultados['Normal FP16'] = df_resultados['Normal FP16'].replace({True: 'Sim', False: 'Não'})
df_resultados['Significativo 5%'] = df_resultados['p-valor'] < 0.05
df_resultados['Significativo 5%'] = df_resultados['Significativo 5%'].replace({True: 'Sim', False: 'Não'})
df_resultados['Significativo 6%'] = df_resultados['p-valor'] < 0.06
df_resultados['Significativo 6%'] = df_resultados['Significativo 6%'].replace({True: 'Sim', False: 'Não'})

# Salvar resultados em um arquivo excel
df_resultados.to_excel('resultados_testes_estatisticos_emissoes_TREINO_sem_VGG.xlsx', index=False)

Unnamed: 0,Métrica,Normal FP32,Normal FP16,levene (homocedasticidade),p-valor,Teste
0,duration,False,False,True,0.018219,Mann-Whitney
1,emissions,False,False,True,0.2539,Mann-Whitney
2,emissions_rate,False,False,True,0.126618,Mann-Whitney
3,cpu_power,False,False,True,3e-05,Mann-Whitney
4,gpu_power,False,True,True,0.920376,Mann-Whitney
5,cpu_energy,False,False,True,0.164801,Mann-Whitney
6,gpu_energy,False,False,True,0.2539,Mann-Whitney
7,ram_energy,False,False,True,0.018219,Mann-Whitney
8,energy_consumed,False,False,True,0.2539,Mann-Whitney
