# Protótipo de Análise e Previsão de Demanda de Energia

Este notebook serve como o **protótipo inicial** para a análise de dados de medidores inteligentes e a previsão de demanda de energia. O objetivo é demonstrar a viabilidade da previsão de carga com base no histórico de consumo, que será a base para a otimização do planejamento de alocação de transformadores e geração distribuída.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from statsmodels.tsa.arima.model import ARIMA
from sklearn.metrics import mean_squared_error
import numpy as np

# Configuração de visualização
sns.set_style("whitegrid")
plt.rcParams['figure.figsize'] = (12, 6)

# 1. Carregamento dos Dados
file_path = '../data/smart_meter_data.csv'
df = pd.read_csv(file_path)
df['timestamp'] = pd.to_datetime(df['timestamp'])
df.set_index('timestamp', inplace=True)

print("Informações Iniciais do Dataset:")
print(df.info())
print("\nPrimeiras 5 linhas:")
print(df.head())

## 2. Análise Exploratória de Dados (EDA)

Para a previsão de demanda total, vamos agregar o consumo de todos os medidores por hora.

In [None]:
# Agregação do consumo total por hora
total_consumption = df.groupby('timestamp')['consumption_kwh'].sum().rename('total_consumption')

# 2.1. Visualização da Série Temporal Total
plt.figure(figsize=(15, 6))
total_consumption.plot(title='Consumo Total de Energia ao Longo do Tempo (kWh)')
plt.xlabel('Data/Hora')
plt.ylabel('Consumo Total (kWh)')
plt.show()

# 2.2. Visualização de um período específico (ex: última semana)
last_week = total_consumption.last('7D')
plt.figure(figsize=(15, 6))
last_week.plot(title='Consumo Total na Última Semana (kWh)')
plt.xlabel('Data/Hora')
plt.ylabel('Consumo Total (kWh)')
plt.show()

## 3. Prototipagem do Modelo de Previsão (ARIMA)

Utilizaremos um modelo **ARIMA (AutoRegressive Integrated Moving Average)** para prototipar a previsão de curto prazo da demanda total de energia. Este modelo é clássico em séries temporais e adequado para capturar a autocorrelação e a tendência dos dados.

In [None]:
# Preparação dos dados para o modelo
ts = total_consumption.copy()

# Divisão em treino e teste (usando o último mês para teste)
train_size = int(len(ts) * 0.95)
train, test = ts[:train_size], ts[train_size:]

print(f"Tamanho do Treino: {len(train)}")
print(f"Tamanho do Teste: {len(test)}")

# 3.1. Treinamento do Modelo ARIMA
# Usaremos uma ordem simples (p=5, d=1, q=0) como protótipo, assumindo sazonalidade e tendência.
order = (5, 1, 0)
try:
    model = ARIMA(train, order=order)
    model_fit = model.fit()
    print("Modelo ARIMA treinado com sucesso.")
except Exception as e:
    print(f"Erro ao treinar o modelo ARIMA: {e}")
    # Em um ambiente real, faríamos a análise de ACF/PACF para determinar a ordem correta.
    # Para o protótipo, assumimos que a ordem (5, 1, 0) é razoável para dados horários.


In [None]:
# 3.2. Realizando a Previsão
start_index = len(train)
end_index = len(ts) - 1
predictions = model_fit.predict(start=start_index, end=end_index, dynamic=False)

# 3.3. Avaliação do Modelo
mse = mean_squared_error(test, predictions)
rmse = np.sqrt(mse)

print(f"MSE (Erro Quadrático Médio): {mse:.2f}")
print(f"RMSE (Raiz do Erro Quadrático Médio): {rmse:.2f}")

# 3.4. Visualização da Previsão vs. Real
plt.figure(figsize=(15, 6))
plt.plot(test.index, test.values, label='Real')
plt.plot(predictions.index, predictions.values, color='red', label='Previsão ARIMA')
plt.title('Previsão de Consumo de Energia (ARIMA) vs. Valores Reais')
plt.xlabel('Data/Hora')
plt.ylabel('Consumo Total (kWh)')
plt.legend()
plt.show()

## Conclusão do Protótipo

O protótipo demonstrou a capacidade de: 
1.  **Processar** os dados de medidores inteligentes.
2.  **Analisar** os padrões de consumo (EDA).
3.  **Prototipar** um modelo de previsão de demanda (ARIMA) com resultados preliminares aceitáveis (baixo RMSE em relação à magnitude dos dados).

Este notebook agora serve como a **prova de conceito (PoC)** que será refatorada em um **serviço de produção** robusto, utilizando **Arquitetura Orientada a Domínio (DDD)**, **Programação Orientada a Objetos (POO)**, **princípios SOLID** e **padrões de projeto** para garantir escalabilidade, manutenibilidade e testabilidade.