In [1]:
import pandas as pd
import duckdb

import dash
from dash import Dash, dcc, html, Input, Output, dash_table
import plotly.express as px

In [2]:
# Caminho do banco
db_path = "../data/duckdb/database.duckdb"

# Conexão com o banco DuckDB
con = duckdb.connect(db_path)

# Carrega os dados de feature engineering
df_previsao = con.execute("""
    SELECT 
        *
                 
    FROM output.previsao_consumo
""").df()

df_consumo= con.execute("""
    SELECT 
          date
        , client_id
        , region
        , consumption_kwh        
    FROM gold.consumo_geral
""").df()

metricas_df = con.execute("""
    SELECT 
        *       
    FROM output.previsao_consumo_metricas
""").df()

In [3]:
dia_previsto = df_consumo['date'].max() + pd.Timedelta(days=1)

df_previsao['date'] = dia_previsto

df_previsao = df_previsao.rename({'forecast' : 'consumption_kwh'},axis=1)

df = pd.concat([df_consumo,df_previsao]).sort_values('date')

df['date'] = pd.to_datetime(df['date'])

df['type'] = df['date'].apply(lambda x: 'Forecast' if x == dia_previsto else 'Real')

In [4]:
dias_semana_map = {
    0: 'Segunda',
    1: 'Terça',
    2: 'Quarta',
    3: 'Quinta',
    4: 'Sexta',
    5: 'Sábado',
    6: 'Domingo'
}

In [None]:
# Inicializa app
app = Dash(__name__)
app.title = "Dashboard de Consumo"

# Lista de regiões únicas ordenadas
region_options = sorted(df['region'].dropna().unique())

app.layout = html.Div([
    html.H2("Consumo de Energia por Cliente"),

    html.Div([
        html.Label("Região"),
        dcc.Dropdown(
            id='region-filter',
            options=[{'label': r, 'value': r} for r in region_options],
            value=region_options[0],
            clearable=False
        ),

        html.Label("Cliente"),
        dcc.Dropdown(
            id='client-filter',
            multi=True,
            placeholder="Selecione um ou mais clientes"
        )
    ], style={'width': '40%', 'display': 'inline-block'}),

    # Aqui: tabela das métricas antes dos gráficos
    html.Div(id='metrics-table', style={'marginBottom': '30px'}),

    dcc.Graph(id='consumo-graph'),
    html.Hr(),
    html.H2("Ciclo de Consumo por Cliente"),
    dcc.Graph(id='ciclo-consumo-graph'),
    html.Hr(),
    html.H2("Total Previsto por Região"),
    dcc.Graph(id='total-regiao-graph'),
    html.H2("Ciclo de Consumo por Região"),
    dcc.Graph(id='ciclo-regiao-graph')
])


@app.callback(
    Output('client-filter', 'options'),
    Output('client-filter', 'value'),
    Input('region-filter', 'value')
)
def update_client_dropdown(selected_region):
    clientes_region = df[df['region'] == selected_region]['client_id'].unique()
    options = [{'label': c, 'value': c} for c in sorted(clientes_region)]
    return options, [clientes_region[0]] if len(clientes_region) > 0 else []


@app.callback(
    Output('metrics-table', 'children'),
    Input('region-filter', 'value')
)
def update_metrics_table(selected_region):
    filtered = metricas_df[metricas_df['region'] == selected_region]

    if filtered.empty:
        return html.Div("Nenhuma métrica disponível para essa região.")

    # Arredonda para 2 casas decimais para visualização
    filtered = filtered.round({'mae': 2, 'rmse': 2, 'nrmse': 2, 'r2': 2})

    return html.Div([
        html.H4(f"Métricas por Cluster – Região: {selected_region}"),
        dash_table.DataTable(
            columns=[{"name": col.upper(), "id": col} for col in ['cluster', 'mae', 'rmse', 'nrmse', 'r2']],
            data=filtered.to_dict('records'),
            style_table={'overflowX': 'auto'},
            style_header={'fontWeight': 'bold', 'backgroundColor': '#f0f0f0'},
            style_cell={'textAlign': 'center', 'padding': '6px'},
        )
    ])


@app.callback(
    Output('consumo-graph', 'figure'),
    Input('region-filter', 'value'),
    Input('client-filter', 'value')
)
def update_graph(selected_region, selected_clients):
    filtered_df = df[df['region'] == selected_region]

    if selected_clients:
        filtered_df = filtered_df[filtered_df['client_id'].isin(selected_clients)]

    forecast_df = filtered_df[filtered_df['type'] == 'Forecast']
    real_df = filtered_df[filtered_df['type'] == 'Real']

    fig = px.line(
        real_df,
        x='date',
        y='consumption_kwh',
        color='client_id',
        title='Consumo Real e Previsto por Cliente',
        labels={'consumption_kwh': 'Consumo (kWh)'}
    )

    fig.add_scatter(
        x=forecast_df['date'],
        y=forecast_df['consumption_kwh'],
        mode='markers',
        name=f"Previsto",
        marker=dict(color='red', symbol='circle')
    )

    fig.update_layout(template='plotly_white')
    return fig


@app.callback(
    Output('total-regiao-graph', 'figure'),
    Input('region-filter', 'value')
)
def update_total_regiao(selected_region):
    total_df = df[df['type'] == 'Forecast']
    grouped = total_df.groupby('region')['consumption_kwh'].sum().reset_index()

    fig = px.bar(
        grouped,
        x='region',
        y='consumption_kwh',
        title='Total Previsto de Consumo por Região',
        labels={'consumption_kwh': 'Consumo Previsto (kWh)', 'region': 'Região'},
        text_auto='.2s',
        color='region'
    )
    fig.update_layout(template='plotly_white')
    return fig


@app.callback(
    Output('ciclo-consumo-graph', 'figure'),
    Input('region-filter', 'value'),
    Input('client-filter', 'value')
)
def update_ciclo_graph(selected_region, selected_clients):
    filtered_df = df[(df['region'] == selected_region) & (df['type'] == 'Real')]

    if not filtered_df.empty and selected_clients:
        filtered_df = filtered_df[filtered_df['client_id'].isin(selected_clients)]

    if filtered_df.empty:
        # Retorna um gráfico vazio amigável
        return px.line(title="Nenhum dado disponível para essa seleção.")

    filtered_df = filtered_df.copy()  # previne o SettingWithCopyWarning
    filtered_df.loc[:, 'dia_semana'] = pd.to_datetime(filtered_df['date']).dt.dayofweek
    filtered_df.loc[:, 'nome_dia'] = filtered_df['dia_semana'].map(dias_semana_map)

    ciclo_df = filtered_df.groupby(['client_id', 'nome_dia'])['consumption_kwh'].mean().reset_index()

    ordem_dias = ['Segunda', 'Terça', 'Quarta', 'Quinta', 'Sexta', 'Sábado', 'Domingo']
    ciclo_df['nome_dia'] = pd.Categorical(ciclo_df['nome_dia'], categories=ordem_dias, ordered=True)

    fig = px.line(
        ciclo_df,
        x='nome_dia',
        y='consumption_kwh',
        color='client_id',
        labels={'nome_dia': 'Dia da Semana', 'consumption_kwh': 'Média Consumo (kWh)'},
        title='Ciclo Semanal de Consumo por Cliente'
    )

    fig.update_layout(template='plotly_white')
    return fig



@app.callback(
    Output('ciclo-regiao-graph', 'figure'),
    Input('region-filter', 'value')
)
def update_ciclo_regiao(selected_region):
    filtered_df = df[(df['type'] == 'Real')]

    filtered_df.loc[:, 'dia_semana'] = pd.to_datetime(filtered_df['date']).dt.dayofweek

    filtered_df.loc[:, 'nome_dia'] = filtered_df['dia_semana'].map(dias_semana_map)

    ciclo_regiao_df = filtered_df.groupby(['region', 'nome_dia'])['consumption_kwh'].mean().reset_index()

    ordem_dias = ['Segunda', 'Terça', 'Quarta', 'Quinta', 'Sexta', 'Sábado', 'Domingo']
    ciclo_regiao_df['nome_dia'] = pd.Categorical(ciclo_regiao_df['nome_dia'], categories=ordem_dias, ordered=True)

    fig = px.line(
        ciclo_regiao_df,
        x='nome_dia',
        y='consumption_kwh',
        color='region',
        labels={'nome_dia': 'Dia da Semana', 'consumption_kwh': 'Média Consumo (kWh)'},
        title='Ciclo Semanal de Consumo por Região'
    )

    fig.update_layout(template='plotly_white')
    return fig


if __name__ == '__main__':
    app.run(debug=True)



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/

# Insights
### Padrões de Consumo por Região
- O consumo previsto total por região permite identificar padrões de demanda, como as regiões com maior ou menor consumo energético.

- Dias de maior consumo por cliente ajudam a detectar padrões sazonais e operacionais, auxiliando na antecipação de picos e planejamento da rede.

- Comportamentos distintos entre regiões podem indicar diferenças no perfil de consumo.

### Aplicações Operacionais e Estratégicas
- Orçamento e controle financeiro: A previsão de consumo permite estimar a receita potencial com base no preço por kWh, ajudando na elaboração de cenários e no acompanhamento de metas.

- Alocação de recursos: Facilita o planejamento de equipes de manutenção, expansão de rede e instalação de equipamentos onde a demanda tende a crescer.

- Antecipação de gargalos: Ao prever aumentos bruscos de consumo em determinada região, é possível agir proativamente para evitar sobrecarga da infraestrutura.

### Potenciais Aplicações Avançadas
- Precificação dinâmica: Com base na previsão de demanda, é possível ajustar tarifas, oferecer incentivos ou aplicar descontos conforme o perfil de consumo regional.

- Campanhas direcionadas: Regiões com alto consumo previsto podem ser alvo de programas de eficiência energética ou incentivos à geração distribuída (ex: painéis solares).

- Planejamento regulatório e estratégico: Apoia decisões de longo prazo em relação a investimentos, sustentabilidade e políticas públicas energéticas.