# Predicciones anomalias

# Librerias

In [91]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
import sklearn.metrics as metrics
from sklearn.metrics import mean_squared_error
import tensorflow as tf
from keras.models import Sequential
from keras.layers import Dense
from tensorflow.keras.models import model_from_json
import plotly.express as px
import warnings
warnings.filterwarnings('ignore')

# Cargue de modelos

In [2]:
# Cargar la arquitectura del modelo desde el archivo JSON
with open("modelo_energiaReactiva.json", "r") as archivo:
    modelo_cargado_ER = archivo.read()

# Reconstruir el modelo desde la arquitectura cargada
modeloER = model_from_json(modelo_cargado_ER)

# Cargar los pesos del modelo desde el archivo HDF5
modeloER.load_weights("modeloER_pesos.weights.h5")

In [3]:
# Cargar la arquitectura del modelo desde el archivo JSON
with open("modelo_energiaActiva.json", "r") as archivo:
    modelo_cargado_EA = archivo.read()

# Reconstruir el modelo desde la arquitectura cargada
modeloEA = model_from_json(modelo_cargado_EA)

# Cargar los pesos del modelo desde el archivo HDF5
modeloEA.load_weights("modeloEA_pesos.weights.h5")

# Predicciones energía activa y reactiva

In [4]:
columnas = ['idCliente', 'Dia', 'Mes', 'Año', 'Hora', 'Minuto']
cliente = list(range(1,31))
dia = list(range(1,30))
mes = 4
año = 2024
hora = list(range(1,25))
minuto = 0

from itertools import product

# Obtener todas las combinaciones de las listas
combinaciones = list(product(cliente, dia, [mes], [año], hora, [minuto]))

# Crear el DataFrame
df = pd.DataFrame(combinaciones, columns=columnas)

# Mostrar las primeras filas del DataFrame
print(df.head())


   idCliente  Dia  Mes   Año  Hora  Minuto
0          1    1    4  2024     1       0
1          1    1    4  2024     2       0
2          1    1    4  2024     3       0
3          1    1    4  2024     4       0
4          1    1    4  2024     5       0


In [5]:
from joblib import load
scaler = load('scalerReg.joblib')
df_scaled = scaler.transform(df)

In [6]:
predEA = modeloEA.predict(df_scaled)
predER = modeloER.predict(df_scaled)

[1m653/653[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 896us/step
[1m653/653[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 682us/step


# Prediccion anomalia

In [7]:
# Cargar la arquitectura del modelo desde el archivo JSON
with open("modelo_clasificacion.json", "r") as archivo:
    modelo_cargado_Clf = archivo.read()

# Reconstruir el modelo desde la arquitectura cargada
modeloClf = model_from_json(modelo_cargado_Clf)

# Cargar los pesos del modelo desde el archivo HDF5
modeloClf.load_weights("modeloClf_pesos.weights.h5")

In [8]:
columnasClf = ['Active_energy', 'Reactive_energy', 'idCliente', 'Dia', 'Mes', 'Año', 'Hora', 'Minuto']
# Convertir el array de NumPy en un DataFrame de pandas
df_predEA = pd.DataFrame(predEA, columns=['Active_energy'])
df_predER = pd.DataFrame(predER, columns=['Reactive_energy'])

# Unir el DataFrame original con el DataFrame del array
df_concatenado = pd.concat([df, df_predEA, df_predER], axis=1)

scalerClf = load('scalerClf.joblib')
dfClf = scalerClf.transform(df_concatenado[columnasClf])

In [9]:
anomalias = modeloClf.predict(dfClf)
dfAnomalias = df_concatenado.copy()
dfAnomalias['Anomalia'] = [round(x[0]) for x in anomalias]

[1m653/653[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 929us/step


In [20]:
dfAnomalias[dfAnomalias.Anomalia == 1]

Unnamed: 0,idCliente,Dia,Mes,Año,Hora,Minuto,Active_energy,Reactive_energy,Anomalia
9311,14,11,4,2024,24,0,-0.508402,1.475501,1
9335,14,12,4,2024,24,0,-0.538937,1.423603,1
9359,14,13,4,2024,24,0,-0.559635,1.386688,1
9383,14,14,4,2024,24,0,-0.575136,1.356002,1
9407,14,15,4,2024,24,0,-0.590637,1.325317,1
9431,14,16,4,2024,24,0,-0.606765,1.302313,1
9455,14,17,4,2024,24,0,-0.622305,1.302694,1
9479,14,18,4,2024,24,0,-0.635644,1.303075,1
9503,14,19,4,2024,24,0,-0.648984,1.298826,1
9527,14,20,4,2024,24,0,-0.657793,1.288282,1


In [11]:
dfAnomalias.groupby(by='Anomalia').count()['idCliente']

Anomalia
0    20856
1       24
Name: idCliente, dtype: int64

In [19]:
dfAnomalias[['Año', 'Mes', 'Dia']]

Unnamed: 0,Año,Mes,Dia
0,2024,4,1
1,2024,4,1
2,2024,4,1
3,2024,4,1
4,2024,4,1
...,...,...,...
20875,2024,4,29
20876,2024,4,29
20877,2024,4,29
20878,2024,4,29


In [22]:
dfAnomalias['Fecha'] = dfAnomalias['Fecha'] = pd.to_datetime(dfAnomalias[['Año', 'Mes', 'Dia']].rename(columns={'Año': 'year', 'Mes': 'month', 'Dia': 'day'})) + pd.to_timedelta(dfAnomalias['Hora'], unit='h')
dfAnomalias

Unnamed: 0,idCliente,Dia,Mes,Año,Hora,Minuto,Active_energy,Reactive_energy,Anomalia,Fecha
0,1,1,4,2024,1,0,3.567378,-1.430366,0,2024-04-01 01:00:00
1,1,1,4,2024,2,0,3.520626,-1.427820,0,2024-04-01 02:00:00
2,1,1,4,2024,3,0,3.497684,-1.425639,0,2024-04-01 03:00:00
3,1,1,4,2024,4,0,3.510372,-1.423461,0,2024-04-01 04:00:00
4,1,1,4,2024,5,0,3.523063,-1.421281,0,2024-04-01 05:00:00
...,...,...,...,...,...,...,...,...,...,...
20875,30,29,4,2024,20,0,0.706298,0.508186,0,2024-04-29 20:00:00
20876,30,29,4,2024,21,0,0.657780,0.528727,0,2024-04-29 21:00:00
20877,30,29,4,2024,22,0,0.614087,0.557927,0,2024-04-29 22:00:00
20878,30,29,4,2024,23,0,0.583764,0.577797,0,2024-04-29 23:00:00


# Anomalias historicas

In [72]:
historico = pd.read_csv('clustersModeloNoSupervisado.csv')
sector = pd.read_excel('data/sector_economico_clientes.xlsx')
sector['idCliente'] = sector.index.values + 1
historico = historico.merge(sector, on='idCliente').rename(columns={'cluster': 'Anomalia'})
historico

Unnamed: 0.1,Unnamed: 0,Fecha,Active_energy,Reactive_energy,Voltaje_FA,Voltaje_FC,idCliente,Fecha2,Dia,Mes,Año,Hora,Minuto,Año_Mes,FactorPotencia,Anomalia,Cliente:,Sector Económico:
0,0,2021-01-01 00:00:00,0.357841,0.282788,455.139171,510.561002,1,2021-01-01,1,1,2021,0,0,2021-01,0.784582,0,Cliente 1,Elaboración de cacao y chocolate y de producto...
1,1,2021-01-01 01:00:00,0.372264,0.431377,469.978787,469.917178,1,2021-01-01,1,1,2021,1,0,2021-01,0.653329,0,Cliente 1,Elaboración de cacao y chocolate y de producto...
2,2,2021-01-01 02:00:00,1.044687,0.338626,468.721120,546.949147,1,2021-01-01,1,1,2021,2,0,2021-01,0.951274,0,Cliente 1,Elaboración de cacao y chocolate y de producto...
3,3,2021-01-01 03:00:00,0.566425,0.495791,452.329255,444.122989,1,2021-01-01,1,1,2021,3,0,2021-01,0.752465,0,Cliente 1,Elaboración de cacao y chocolate y de producto...
4,4,2021-01-01 04:00:00,1.080556,0.472018,513.477596,535.463719,1,2021-01-01,1,1,2021,4,0,2021-01,0.916383,0,Cliente 1,Elaboración de cacao y chocolate y de producto...
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
463410,11410,2022-04-21 10:00:00,0.960105,0.473234,1273.150602,1027.084539,30,2022-04-21,21,4,2022,10,0,2022-04,0.896961,0,Cliente 30,Venta al por mayor de metales y minerales meta...
463411,11411,2022-04-21 11:00:00,0.624300,0.699936,1063.524968,1205.829819,30,2022-04-21,21,4,2022,11,0,2022-04,0.665634,0,Cliente 30,Venta al por mayor de metales y minerales meta...
463412,11412,2022-04-21 12:00:00,0.985633,0.123560,1207.284283,1127.893714,30,2022-04-21,21,4,2022,12,0,2022-04,0.992234,0,Cliente 30,Venta al por mayor de metales y minerales meta...
463413,11413,2022-04-21 13:00:00,0.710436,0.399262,1205.012971,1090.835898,30,2022-04-21,21,4,2022,13,0,2022-04,0.871763,0,Cliente 30,Venta al por mayor de metales y minerales meta...


# Gráficas

## Grafica de prediccion anomalia

In [54]:
fig = px.scatter(dfAnomalias.replace(0, ''), x='Active_energy', y='Reactive_energy',
                 title='Predicción de anomalias',
                 color="Anomalia")
fig.show()

## Gráfica de clientes con mayor cantidad de anomalias

In [82]:
dfH = historico[['idCliente','Sector Económico:','Anomalia']].groupby(by=['idCliente','Sector Económico:'],as_index=False).sum()
fig = px.treemap(dfH, 
                 path=['Sector Económico:','idCliente'],
                 values='Anomalia',
                 #parents=['Sector Económico:'],
                 title='Clientes con más anomalias')
fig.show()

## Gráfica de radar de sectores con mayor cantidad de anomalias

In [98]:
import plotly.graph_objects as go

dfHS = dfH[['Sector Económico:','Anomalia']].groupby(by='Sector Económico:',as_index=False).mean()

# Crear gráfica tipo radar
fig = go.Figure()

fig.add_trace(go.Scatterpolar(
    r=dfHS['Anomalia'],
    theta=dfHS['Sector Económico:'],
    fill='toself',
    name='Anomalia'
))

# Actualizar el diseño de la gráfica
fig.update_layout(
    polar=dict(
        radialaxis=dict(
            visible=True,
            range=[0, 4550]
        )
    ),
    title='Gráfica tipo Radar - Anomalías por Sector Económico'
)

# Mostrar la gráfica
fig.show()
