In [19]:
import os
import pandas as pd
pd.set_option('display.max_rows', None)
pd.set_option('display.float_format', '{:.6f}'.format)

arquivos_csv = [f for f in os.listdir() if f.endswith('.csv')]

dataframes = []

for arquivo in arquivos_csv:
    try:
        df = pd.read_csv(arquivo, sep=';') 
        pass
    except Exception:
        continue
    df['Arquivo'] = arquivo 
    df = df[['Trafo', 'RMSE', 'MAE', 'Arquivo']]
    dataframes.append(df)

df_concatenado = pd.concat(dataframes, ignore_index=True)
df_concatenado = df_concatenado.dropna(how='any')

# Encontrando o arquivo com menor RMSE para cada trafo
min_rmse_files = df_concatenado.loc[df_concatenado.groupby("Trafo")["RMSE"].idxmin(), "Arquivo"]

# Contando quantas vezes cada arquivo aparece como menor RMSE
arquivo_counts = min_rmse_files.value_counts()

print('Qtd melhor resultado:')
print(arquivo_counts)

# Encontrando os dois menores RMSE para cada trafo
df_sorted = df_concatenado.sort_values(["Trafo", "RMSE"])
second_min_files = df_sorted.groupby("Trafo").nth(1)["Arquivo"]

# Contando quantas vezes cada arquivo aparece como segundo menor RMSE
second_min_counts = second_min_files.value_counts()

print('\nQtd segundo melhor resultado:')
print(second_min_counts)

# Encontrando os tres menores RMSE para cada trafo
third_min_files = df_sorted.groupby("Trafo").nth(2)["Arquivo"]

# Contando quantas vezes cada arquivo aparece como terceiro menor RMSE
third_min_counts = third_min_files.value_counts()

print('\nQtd terceiro melhor resultado:')
print(third_min_counts)

# Pega os 3 melhores RMSE para cada trafo
top3_files = df_sorted.groupby("Trafo").head(3)

top3_pivot = top3_files.assign(Rank=top3_files.groupby("Trafo").cumcount()+1).pivot(index="Trafo", columns="Rank", values="Arquivo")
top3_pivot.columns = ["Melhor", "Segundo Melhor", "Terceiro Melhor"]

top3_pivot = top3_pivot.reset_index()  # Transforma o índice em coluna
top3_pivot.columns = ['Trafo', 'Melhor', 'Segundo Melhor', 'Terceiro Melhor']  # Renomeia as colunas

top3_pivot.dropna(how='any')


Qtd melhor resultado:
Arquivo
SVR_S.csv              20
LSTM_S_GD.csv           6
SVR_S-GD.csv            3
LGBM_S_GD.csv           3
LSTM_S_Clientes.csv     3
GBR_S.csv               2
GBR_S_GD.csv            2
LGBM_S.csv              1
LSTM_S.csv              1
Name: count, dtype: int64

Qtd segundo melhor resultado:
Arquivo
LSTM_S.csv                8
SVR_S.csv                 6
LSTM_S_GD.csv             6
LGBM_S_GD.csv             5
LSTM_S_Clientes.csv       4
LSTM_S_GD_Clientes.csv    3
GBR_S_GD.csv              3
GBR_S.csv                 2
LGBM_S.csv                2
catboost_S_GD.csv         1
SVR_S-GD.csv              1
Name: count, dtype: int64

Qtd terceiro melhor resultado:
Arquivo
LSTM_S_GD_Clientes.csv    8
GBR_S_GD.csv              6
LSTM_S_GD.csv             5
LGBM_S.csv                4
GBR_S.csv                 4
LSTM_S.csv                3
LSTM_S_Clientes.csv       3
LGBM_S_GD.csv             2
SVR_S-Clientes.csv.csv    2
XGB_S.csv                 1
RFR_S.csv        

Unnamed: 0,Trafo,Melhor,Segundo Melhor,Terceiro Melhor
0,ARA_DJ_12B1,SVR_S-GD.csv,SVR_S.csv,LGBM_S_GD.csv
1,ARR_DJ_12B1,LSTM_S_GD.csv,LSTM_S_Clientes.csv,LSTM_S_GD_Clientes.csv
2,BJC_DJ_12B1,LSTM_S_GD.csv,LSTM_S_GD_Clientes.csv,LSTM_S.csv
3,BQR_DJ_12B1,SVR_S.csv,LSTM_S.csv,LSTM_S_GD.csv
4,BSA_DJ_12B1,SVR_S.csv,LSTM_S.csv,SVR_S-Clientes.csv.csv
5,CPX_DJ_12B1,LGBM_S_GD.csv,GBR_S.csv,XGB_S.csv
6,CRI_DJ_12B1,SVR_S.csv,LGBM_S_GD.csv,LGBM_S.csv
7,CRM_DJ_12T1,LSTM_S_GD.csv,LSTM_S.csv,LSTM_S_Clientes.csv
8,CTE_DJ_12B1,LGBM_S.csv,SVR_S.csv,RFR_S.csv
9,DST_DJ_12B1,SVR_S.csv,catboost_S_GD.csv,GBR_S_GD.csv


In [20]:
df_concatenado.to_csv('Resumo_Resultados.csv', sep=';', index=False)

In [21]:
top15_GD = {
    "TRAFO": [
        "PTS_DJ_12B1", "JTB_DJ_12B1", "CTR_DJ_12B1", "CJZ_DJ_12B1", "SZA_DJ_12B2",
        "CBD_DJ_12B1", "SBT_DJ_12B1", "SZA_DJ_12B1", "ABR_DJ_12B1", "PBL_DJ_12B1",
        "PRT_DJ_12B1", "CTL_DJ_12B1", "GBA_DJ_12B2", "SGL_DJ_12T1", "MGB_DJ_12B2"
    ],
    "PotenciaAcumulada": [
        18.11019000000007, 14.390984999999995, 12.482614999999988, 11.970245000000013, 11.226030000000003,
        10.83012999999999, 10.829459999999996, 9.407430000000025, 8.66734999999998, 8.325459999999996,
        8.020819999999983, 8.012269999999988, 7.1918599999999895, 7.179259999999999, 7.032454999999988
    ]
}

In [22]:
df_concatenado[["Modelo", "Features"]] = df_concatenado["Arquivo"].str.split("_", n=1, expand=True)
df_concatenado = df_concatenado.drop("Arquivo", axis=1)

In [23]:
ver_GD_top3 = top3_pivot[top3_pivot['Trafo'].isin(top15_GD['TRAFO'])]
ver_GD_top3

Unnamed: 0,Trafo,Melhor,Segundo Melhor,Terceiro Melhor
16,JTB_DJ_12B1,SVR_S.csv,LGBM_S_GD.csv,GBR_S_GD.csv
23,PBL_DJ_12B1,LSTM_S.csv,SVR_S.csv,LSTM_S_Clientes.csv
28,PTS_DJ_12B1,GBR_S_GD.csv,LGBM_S_GD.csv,GBR_S.csv
39,SZA_DJ_12B2,LSTM_S_GD.csv,LSTM_S_Clientes.csv,LSTM_S_GD_Clientes.csv


In [24]:
ver_GD = df_concatenado[df_concatenado['Trafo'].isin(top15_GD['TRAFO'])]
ver_GD.sort_values('RMSE')

Unnamed: 0,Trafo,RMSE,MAE,Modelo,Features
272,PBL_DJ_12B1,0.520447,0.380448,LSTM,S.csv
696,PBL_DJ_12B1,0.547005,0.404485,SVR,S.csv
312,PBL_DJ_12B1,0.55956,0.410933,LSTM,S_Clientes.csv
350,PBL_DJ_12B1,0.570332,0.423149,LSTM,S_GD.csv
388,PBL_DJ_12B1,0.603386,0.459564,LSTM,S_GD_Clientes.csv
114,PBL_DJ_12B1,0.622597,0.469323,GBR,S.csv
154,PBL_DJ_12B1,0.624234,0.476771,GBR,S_GD.csv
335,SZA_DJ_12B2,0.625714,0.482514,LSTM,S_GD.csv
657,PBL_DJ_12B1,0.629032,0.49207,SVR,S-GD.csv
297,SZA_DJ_12B2,0.634987,0.483935,LSTM,S_Clientes.csv
