<a href="https://colab.research.google.com/github/kethelineberlin/Intelig-ncia-Computacional-Aplicada-Gera-o-de-Energia-e-Sustentabilidade/blob/main/Untitled2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [5]:
# =============================================================
# Análise Estatística Descritiva das Métricas de Processamento
# de Imagens do MHP (Maciel, 2022)
# =============================================================

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

plt.rcParams['figure.figsize'] = (9,5)
plt.rcParams['axes.grid'] = True

# -------------------------------------------------------------
# 1. Carregamento e inspeção
# -------------------------------------------------------------
# Suba o arquivo metricas_MHP_realista.csv para o Colab (menu lateral -> arquivos)
# ou substitua o caminho abaixo pelo local correto

df = pd.read_csv('metricas_MHP_realista.csv', parse_dates=['tempo'])
df = df.sort_values(['condicao_ceu','tempo','horizonte_min']).reset_index(drop=True)

print('Dimensões:', df.shape)
print('Condições de céu:', df['condicao_ceu'].unique())
print('Horizontes (min):', df['horizonte_min'].unique())

df.head()

# -------------------------------------------------------------
# 2. Estatística descritiva global
# -------------------------------------------------------------
num_cols = ['clouds_movement','clouds_coverage','clouds_around_sun','sun_luminance',
            'sun_luminance_adjusted','sun_located','white_pixel_ratio',
            'clear_sky_ghi','folsom_ghi','mse']

desc_global = df[num_cols].describe().T
desc_global


# -------------------------------------------------------------
# 3. Estatísticas por condição de céu
# -------------------------------------------------------------
stats_cond = df.groupby('condicao_ceu')[num_cols].agg(['mean','median','std','min','max'])
stats_cond

# -------------------------------------------------------------
# 4. Estatísticas por horizonte de predição
# -------------------------------------------------------------
stats_h = df.groupby('horizonte_min')[num_cols].agg(['mean','median','std','min','max'])
stats_h


# -------------------------------------------------------------
# 5. Histogramas das métricas
# -------------------------------------------------------------
for col in num_cols:
    plt.figure()
    plt.hist(df[col].dropna(), bins=30)
    plt.xlabel(col)
    plt.ylabel('Frequência')
    plt.title(f'Histograma – {col}')
    plt.tight_layout()
    plt.show()

# -------------------------------------------------------------
# 6. Boxplots – MSE por condição de céu
# -------------------------------------------------------------
labels = list(df['condicao_ceu'].unique())
data = [df[df['condicao_ceu']==c]['mse'].values for c in labels]

plt.boxplot(data)
plt.xticks(range(1,len(labels)+1), labels)
plt.ylabel('MSE')
plt.title('MSE por condição de céu')
plt.tight_layout()
plt.show()


# -------------------------------------------------------------
# 7. Matriz de correlação
# -------------------------------------------------------------
corr = df[num_cols].corr()

fig, ax = plt.subplots()
im = ax.imshow(corr.values, interpolation='nearest')
ax.set_xticks(range(len(corr.columns)))
ax.set_yticks(range(len(corr.columns)))
ax.set_xticklabels(corr.columns, rotation=45, ha='right')
ax.set_yticklabels(corr.columns)
plt.title('Matriz de Correlação')
plt.colorbar(im)
plt.tight_layout()
plt.show()

corr

# -------------------------------------------------------------
# 8. Séries temporais (inspiração na Figura 29)
# -------------------------------------------------------------
cond_ex = 'parcialmente_nublado'   # escolha da condição
hor_ex = 15                        # horizonte de predição
ex = df[(df['condicao_ceu']==cond_ex) & (df['horizonte_min']==hor_ex)].sort_values('tempo')

cols_plot = ['mse','clouds_coverage','clouds_around_sun','clear_sky_ghi',
             'sun_luminance','sun_luminance_adjusted','sun_located',
             'white_pixel_ratio','folsom_ghi']

for c in cols_plot:
    plt.figure()
    plt.plot(ex['tempo'], ex[c])
    plt.xlabel('Tempo')
    plt.ylabel(c)
    plt.title(f'{c} – {cond_ex}, horizonte {hor_ex} min')
    plt.tight_layout()
    plt.show()


# -------------------------------------------------------------
# 9. Comparação MSE × horizonte × condição de céu
# -------------------------------------------------------------
summary = df.groupby(['condicao_ceu', 'horizonte_min'])['mse'].agg(['mean','std']).reset_index()
summary


# -------------------------------------------------------------
# 10. Gráfico de tendência do MSE por horizonte e condição
# -------------------------------------------------------------
plt.figure(figsize=(9,6))
for cond in df['condicao_ceu'].unique():
    subset = summary[summary['condicao_ceu']==cond]
    plt.plot(subset['horizonte_min'], subset['mean'], marker='o', label=cond)

plt.xlabel('Horizonte de predição (min)')
plt.ylabel('MSE médio')
plt.title('Tendência do erro (MSE) por condição de céu e horizonte')
plt.legend(title='Condição de céu')
plt.grid(True)
plt.tight_layout()
plt.show()


# -------------------------------------------------------------
# 11. Interpretação automática e tabela resumo
# -------------------------------------------------------------
def resumo(df_sub):
    return {
        'mse_med': df_sub['mse'].mean(),
        'cov_med': df_sub['clouds_coverage'].mean(),
        'wpr_med': df_sub['white_pixel_ratio'].mean(),
        'lum_med': df_sub['sun_luminance'].mean(),
        'ghi_med': df_sub['folsom_ghi'].mean(),
    }

out = {
    'limpo': resumo(df[df['condicao_ceu']=='limpo']),
    'parcialmente_nublado': resumo(df[df['condicao_ceu']=='parcialmente_nublado']),
    'nublado_chuvoso': resumo(df[df['condicao_ceu']=='nublado_chuvoso'])
}

pd.DataFrame(out)


# -------------------------------------------------------------
# 12. Comentário interpretativo (saída textual)
# -------------------------------------------------------------
for cond in df['condicao_ceu'].unique():
    subset = summary[summary['condicao_ceu']==cond]
    ini = subset['mean'].iloc[0]
    fim = subset['mean'].iloc[-1]
    print(f"Condição '{cond}': MSE médio cresce de {ini:.1f} para {fim:.1f} ao longo do horizonte, "
          "indicando aumento de incerteza previsional conforme a complexidade do céu.")

    from google.colab import files
uploaded = files.upload()  # selecione o arquivo .csv quando o menu aparecer

import pandas as pd
df = pd.read_csv('metricas_MHP_realista.csv', parse_dates=['tempo'])



FileNotFoundError: [Errno 2] No such file or directory: 'metricas_MHP_realista.csv'

In [12]:
from google.colab import files
uploaded = files.upload()  # selecione o arquivo .csv quando o menu aparecer

import pandas as pd
df = pd.read_csv('metricas_MHP_realista.csv', parse_dates=['tempo'])

import pandas as pd

# Caminho correto do arquivo após upload
df = pd.read_csv('/content/metricas_MHP_realista.csv', parse_dates=['tempo'])

print(df.shape)
df.head()



Saving metricas_MHP_realista.csv to metricas_MHP_realista (3).csv
(3024, 13)


Unnamed: 0,tempo,condicao_ceu,clear_sky_ghi,folsom_ghi,clouds_coverage,clouds_around_sun,sun_luminance,sun_luminance_adjusted,sun_located,white_pixel_ratio,horizonte_min,clouds_movement,mse
0,2014-09-02 06:00:00,limpo,0.0,0.018452,0.049297,0,0.036412,0.036412,0,0.055593,1,0.038331,135.004446
1,2014-09-02 06:05:00,limpo,0.0,4.481183,0.052143,0,0.011967,0.011967,0,0.011891,1,0.147221,172.724735
2,2014-09-02 06:10:00,limpo,0.0,0.0,0.027431,0,0.002597,0.002597,0,0.051627,1,0.07743,0.0
3,2014-09-02 06:15:00,limpo,0.0,0.0,0.063644,0,0.0,0.0,0,0.060487,1,0.043026,134.968063
4,2014-09-02 06:20:00,limpo,0.0,0.0,0.033821,0,0.012127,0.012127,0,0.035187,1,0.120725,143.878843
