In [None]:
PRED_PATH = "predictions_full.csv"  
EXPORT_PATH = "predictions_powerbi.csv"   

import pandas as pd
import matplotlib.pyplot as plt
from sklearn.metrics import mean_absolute_error, mean_squared_error
import numpy as np

df = pd.read_csv(PRED_PATH, low_memory=False)
print(df.head())

target = 'UMIDADE_REL'
pred_col = target + '_pred'
if target not in df.columns or pred_col not in df.columns:
    raise ValueError(f'Esperado colunas {target} e {pred_col} em {PRED_PATH}')

mae = mean_absolute_error(df[target], df[pred_col])
mse = mean_squared_error(df[target], df[pred_col])
rmse = rmse = np.sqrt(mse)
print(f'MAE: {mae:.4f}')
print(f'RMSE: {rmse:.4f}')

df['UMIDADE_ABS_ERROR'] = (df[target] - df[pred_col]).abs()

# Time series plot (first 500 rows)
plt.figure(figsize=(12,4))
df[[target, pred_col]].iloc[:500].reset_index(drop=True).plot(title='Real vs Previsto (sample)')
plt.ylabel('Umidade (%)')
plt.tight_layout()
plt.savefig("plot_umidade.png")  # salva como imagem
plt.close()  # fecha a figura para não travar
print("Gráfico salvo como plot_umidade.png")

# Export a clean CSV for Power BI
cols_keep = [c for c in df.columns]
df[cols_keep].to_csv(EXPORT_PATH, index=False)
print('Arquivo final para Power BI salvo em', EXPORT_PATH)
