In [8]:
import pandas as pd
import numpy as np
from datetime import datetime, timedelta
import random

# Configuraci√≥n inicial
np.random.seed(42)  # Para reproducibilidad
dias = 365  # 1 a√±o de datos
fecha_inicio = datetime(2025, 1, 1)

# 1. Datos principales de generaci√≥n y consumo
def generar_datos_fotovoltaicos(dias):
    fechas = [fecha_inicio + timedelta(days=i) for i in range(dias)]

    datos = {
        'Fecha': fechas,
        'Radiacion_kWh_m2': np.random.normal(loc=5.0, scale=1.5, size=dias).clip(2, 8),  # Radiaci√≥n solar
        'Temp_ambiente_C': np.random.normal(loc=25, scale=5, size=dias).clip(10, 40),    # Temperatura
        'Horas_pico_sol': np.random.uniform(3.5, 6.5, size=dias),                        # Horas de sol pico
        'Eficiencia_paneles': np.random.normal(loc=78, scale=3, size=dias).clip(70, 85)  # Eficiencia %
    }

    df = pd.DataFrame(datos)

    # C√°lculo de energ√≠a generada (depende de radiaci√≥n, horas pico y eficiencia)
    df['Energia_generada_kWh'] = (
        df['Radiacion_kWh_m2'] *
        df['Horas_pico_sol'] *
        1000 *  # Suponemos una planta de 1000 m2 (1 MWp aprox)
        (df['Eficiencia_paneles'] / 100) *
        (1 - 0.005 * (df['Temp_ambiente_C'] - 25))  # P√©rdidas por temperatura
    ).round(1)

    # A√±adir estacionalidad (m√°s generaci√≥n en verano)
    df['Energia_generada_kWh'] = df.apply(
        lambda x: x['Energia_generada_kWh'] * (1 + 0.3 * np.sin((x['Fecha'].timetuple().tm_yday / 365) * 2 * np.pi)),
        axis=1
    ).round(1)

    # Generar datos de consumo (correlacionado parcialmente con generaci√≥n)
    df['Consumo_total_kWh'] = (
        df['Energia_generada_kWh'] *
        np.random.uniform(0.7, 1.3, size=dias) *
        (1 - 0.2 * np.sin((df['Fecha'].dt.month - 1) / 12 * 2 * np.pi))  # Menor consumo en verano
    ).round(1)

    # Autoconsumo y excedentes
    df['Autoconsumo_kWh'] = np.minimum(df['Energia_generada_kWh'], df['Consumo_total_kWh'] * 0.6)
    df['Excedentes_kWh'] = df['Energia_generada_kWh'] - df['Autoconsumo_kWh']

    # P√©rdidas por mantenimiento (eventos aleatorios)
    df['Evento_mantenimiento'] = ''
    df['Perdida_energia_kWh'] = 0

    for i in range(random.randint(5, 10)):  # Entre 5 y 10 eventos al a√±o
        dia = random.randint(0, dias-1)
        df.loc[dia, 'Perdida_energia_kWh'] = random.uniform(50, 300)
        df.loc[dia, 'Evento_mantenimiento'] = random.choice([
            'Limpieza paneles', 'Fallo inversor', 'Reparaci√≥n cableado',
            'Mantenimiento preventivo', 'Actualizaci√≥n software'
        ])
        # Ajustar generaci√≥n ese d√≠a
        df.loc[dia, 'Energia_generada_kWh'] -= df.loc[dia, 'Perdida_energia_kWh']

    return df

# Generar los datos
df_solar = generar_datos_fotovoltaicos(dias)

# 2. Datos de predicci√≥n (modelo simplificado)
def generar_predicciones(df):
    meses = df.groupby(df['Fecha'].dt.month).agg({
        'Energia_generada_kWh': 'sum'
    }).reset_index()

    meses['Energia_predicha_kWh'] = meses['Energia_generada_kWh'] * np.random.uniform(0.95, 1.05, size=12)
    meses['Error_prediccion_pct'] = (
        (meses['Energia_predicha_kWh'] - meses['Energia_generada_kWh']) /
        meses['Energia_generada_kWh'] * 100
    ).round(1)

    meses.rename(columns={'Fecha': 'Mes'}, inplace=True)
    return meses

df_predicciones = generar_predicciones(df_solar)

# 3. Datos horarios (para gr√°fica de distribuci√≥n diaria)
def generar_datos_horarios():
    horas = pd.DataFrame({'Hora': range(24)})

    # Curva t√≠pica de generaci√≥n solar (campana centrada en 12:00)
    horas['Generacion_kWh'] = (100 * np.exp(-0.5 * ((horas['Hora'] - 12) ** 2 / 4)).round(1))

    # Consumo t√≠pico (picos ma√±ana y tarde)
    horas['Consumo_kWh'] = (
        50 + 30 * np.sin(horas['Hora'] / 24 * 2 * np.pi) +
        20 * np.sin(3 * horas['Hora'] / 24 * 2 * np.pi)
    ).round(1)

    return horas

df_horario = generar_datos_horarios()

# Guardar en archivos CSV
df_solar.to_csv('datos_planta_solar.csv', index=False)
df_predicciones.to_csv('predicciones_solar.csv', index=False)
df_horario.to_csv('consumo_horario.csv', index=False)

print("‚úÖ Base de datos generada exitosamente!")
print(f"- Registros diarios: {len(df_solar)}")
print(f"- Meses predichos: {len(df_predicciones)}")
print(f"- Perfil horario: {len(df_horario)} horas")

‚úÖ Base de datos generada exitosamente!
- Registros diarios: 365
- Meses predichos: 12
- Perfil horario: 24 horas



Setting an item of incompatible dtype is deprecated and will raise an error in a future version of pandas. Value '144.05707143393033' has dtype incompatible with int64, please explicitly cast to a compatible dtype first.



In [9]:
import pandas as pd
import numpy as np
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
from datetime import datetime
import os

# Crear carpeta para guardar gr√°ficas si no existe
if not os.path.exists('graficas'):
    os.makedirs('graficas')

# 1. Cargar datos generados (o usar los del c√≥digo anterior)
df_solar = pd.read_csv('datos_planta_solar.csv', parse_dates=['Fecha'])
df_pred = pd.read_csv('predicciones_solar.csv')
df_horario = pd.read_csv('consumo_horario.csv')

# 2. An√°lisis de datos (funciones reutilizables)
def analizar_eficiencia(df):
    """Analiza la eficiencia vs temperatura"""
    df['Mes'] = df['Fecha'].dt.month_name()
    return df.groupby('Mes').agg({
        'Eficiencia_paneles': 'mean',
        'Temp_ambiente_C': 'mean'
    }).reset_index()

df_eficiencia = analizar_eficiencia(df_solar)

# 3. Generar todas las gr√°ficas en HTML
def generar_graficas():
    # Gr√°fica 1: Producci√≥n vs Consumo mensual
    df_mensual = df_solar.resample('M', on='Fecha').sum().reset_index()
    fig1 = make_subplots(specs=[[{"secondary_y": True}]])

    fig1.add_trace(
        go.Bar(x=df_mensual['Fecha'], y=df_mensual['Energia_generada_kWh'],
               name='Generaci√≥n', marker_color='#18a3cf'),
        secondary_y=False
    )

    fig1.add_trace(
        go.Scatter(x=df_mensual['Fecha'], y=df_mensual['Consumo_total_kWh'],
                   name='Consumo', line=dict(color='#e24d0d', width=3)),
        secondary_y=True
    )

    fig1.update_layout(
        title='Generaci√≥n vs Consumo Mensual',
        xaxis_title='Mes',
        yaxis_title='Energ√≠a Generada (kWh)',
        yaxis2_title='Energ√≠a Consumida (kWh)',
        template='plotly_white'
    )
    fig1.write_html('graficas/produccion_consumo.html')

    # Gr√°fica 2: Eficiencia de paneles
    fig2 = px.scatter(
        df_eficiencia,
        x='Temp_ambiente_C',
        y='Eficiencia_paneles',
        color='Mes',
        size=[10]*12,
        title='Eficiencia de Paneles vs Temperatura',
        labels={'Temp_ambiente_C': 'Temperatura (¬∞C)',
                'Eficiencia_paneles': 'Eficiencia (%)'},
        color_discrete_sequence=px.colors.sequential.Blues_r
    )
    fig2.write_html('graficas/eficiencia_paneles.html')

    # Gr√°fica 3: Distribuci√≥n horaria
    fig3 = go.Figure()
    fig3.add_trace(go.Scatter(
        x=df_horario['Hora'],
        y=df_horario['Generacion_kWh'],
        name='Generaci√≥n',
        line=dict(color='#5bd1e7', width=3)
    ))
    fig3.add_trace(go.Scatter(
        x=df_horario['Hora'],
        y=df_horario['Consumo_kWh'],
        name='Consumo',
        line=dict(color='#39badb', width=3, dash='dot')
    ))
    fig3.update_layout(
        title='Distribuci√≥n Horaria T√≠pica',
        xaxis_title='Hora del d√≠a',
        yaxis_title='Energ√≠a (kWh)',
        showlegend=True
    )
    fig3.write_html('graficas/distribucion_horaria.html')

    # Gr√°fica 4: Matriz de correlaci√≥n
    corr_matrix = df_solar[[
        'Energia_generada_kWh', 'Radiacion_kWh_m2',
        'Temp_ambiente_C', 'Horas_pico_sol'
    ]].corr()

    fig4 = px.imshow(
        corr_matrix,
        labels=dict(x="Variable", y="Variable", color="Correlaci√≥n"),
        x=corr_matrix.columns,
        y=corr_matrix.columns,
        color_continuous_scale=px.colors.diverging.RdBu_r,
        title='Matriz de Correlaci√≥n'
    )
    fig4.write_html('graficas/matriz_correlacion.html')

    # Gr√°fica 5: Tendencia anual
    df_solar['Mes'] = df_solar['Fecha'].dt.month
    df_anual = df_solar.groupby('Mes').agg({
        'Energia_generada_kWh': 'sum',
        'Consumo_total_kWh': 'sum'
    }).reset_index()

    fig5 = px.line(
        df_anual,
        x='Mes',
        y=['Energia_generada_kWh', 'Consumo_total_kWh'],
        title='Tendencia Anual de Generaci√≥n y Consumo',
        labels={'value': 'Energ√≠a (kWh)', 'variable': 'Tipo'},
        color_discrete_sequence=['#18a3cf', '#39badb']
    )
    fig5.write_html('graficas/tendencia_anual.html')

    # Gr√°fica 6: Predicci√≥n vs Real
    fig6 = go.Figure()
    fig6.add_trace(go.Bar(
        x=df_pred['Mes'],
        y=df_pred['Energia_generada_kWh'],
        name='Real',
        marker_color='#7ce8f3'
    ))
    fig6.add_trace(go.Scatter(
        x=df_pred['Mes'],
        y=df_pred['Energia_predicha_kWh'],
        name='Predicci√≥n',
        line=dict(color='#212492', width=3)
    ))
    fig6.update_layout(
        title='Predicci√≥n vs Generaci√≥n Real',
        xaxis_title='Mes',
        yaxis_title='Energ√≠a (kWh)',
        barmode='group'
    )
    fig6.write_html('graficas/prediccion_consumo.html')

# Ejecutar generaci√≥n de gr√°ficas
generar_graficas()

print("üìä ¬°Gr√°ficas generadas con √©xito!")
print(f"üìç Ubicaci√≥n: {os.path.abspath('graficas')}")
print("\nGr√°ficas creadas:")
print("- produccion_consumo.html")
print("- eficiencia_paneles.html")
print("- distribucion_horaria.html")
print("- matriz_correlacion.html")
print("- tendencia_anual.html")
print("- prediccion_consumo.html")


'M' is deprecated and will be removed in a future version, please use 'ME' instead.



üìä ¬°Gr√°ficas generadas con √©xito!
üìç Ubicaci√≥n: /content/graficas

Gr√°ficas creadas:
- produccion_consumo.html
- eficiencia_paneles.html
- distribucion_horaria.html
- matriz_correlacion.html
- tendencia_anual.html
- prediccion_consumo.html


In [10]:
import pandas as pd
import numpy as np
import plotly.graph_objects as go
from plotly.subplots import make_subplots
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error, r2_score
import os

# Configuraci√≥n est√©tica
COLOR_GENERACION = '#18a3cf'
COLOR_CONSUMO = '#39badb'
COLOR_PREDICCION = '#e24d0d'
COLOR_RESIDUAL = '#7ce8f3'

# 1. Datos sint√©ticos (simulando 1 a√±o de operaci√≥n)
np.random.seed(42)
meses = pd.date_range('2025-01-01', periods=12, freq='M')
generacion = np.array([4200, 4500, 5200, 5800, 6200, 6500, 6400, 6100, 5600, 5000, 4400, 4000]) * np.random.uniform(0.95, 1.05, 12)
consumo = generacion * np.random.uniform(0.7, 0.9, 12) * np.array([1.1, 1.0, 0.9, 0.85, 0.8, 0.75, 0.78, 0.82, 0.88, 0.95, 1.0, 1.05])

df_mensual = pd.DataFrame({
    'Mes': meses.strftime('%Y-%m'),
    'Generacion_kWh': generacion,
    'Consumo_kWh': consumo,
    'Radiacion_prom': [4.2, 4.5, 5.3, 5.8, 6.2, 6.5, 6.4, 6.1, 5.6, 5.0, 4.4, 4.0],
    'Temp_prom': [22, 23, 25, 27, 29, 31, 30, 29, 27, 25, 23, 22]
})

# 2. Gr√°fica Generaci√≥n vs Consumo por Mes (Doble Eje)
fig1 = make_subplots(specs=[[{"secondary_y": True}]])

fig1.add_trace(
    go.Bar(
        x=df_mensual['Mes'],
        y=df_mensual['Generacion_kWh'],
        name='Generaci√≥n',
        marker_color=COLOR_GENERACION,
        opacity=0.8
    ),
    secondary_y=False
)

fig1.add_trace(
    go.Scatter(
        x=df_mensual['Mes'],
        y=df_mensual['Consumo_kWh'],
        name='Consumo',
        line=dict(color=COLOR_CONSUMO, width=3),
        mode='lines+markers',
        marker=dict(size=8)
    ),
    secondary_y=True
)

fig1.update_layout(
    title='<b>Generaci√≥n vs Consumo Mensual</b>',
    xaxis_title='Mes',
    yaxis_title='Generaci√≥n (kWh)',
    yaxis2_title='Consumo (kWh)',
    template='plotly_white',
    hovermode='x unified',
    annotations=[
        dict(
            x=0.5,
            y=1.15,
            xref='paper',
            yref='paper',
            text='La generaci√≥n supera el consumo en meses de verano',
            showarrow=False,
            font=dict(size=12)
        )
    ]
)

# 3. Gr√°fica Comparaci√≥n por Meses (Heatmap)
df_comparacion = df_mensual.melt(id_vars=['Mes'], value_vars=['Generacion_kWh', 'Consumo_kWh'])
df_comparacion['Porcentaje'] = df_comparacion.groupby('Mes')['value'].transform(lambda x: x/x.sum()*100)

fig2 = px.bar(
    df_comparacion,
    x='Mes',
    y='value',
    color='variable',
    barmode='group',
    color_discrete_map={
        'Generacion_kWh': COLOR_GENERACION,
        'Consumo_kWh': COLOR_CONSUMO
    },
    text='Porcentaje',
    labels={'value': 'Energ√≠a (kWh)', 'variable': 'Tipo'},
    title='<b>Comparaci√≥n Mensual Generaci√≥n/Consumo</b>'
)

fig2.update_traces(
    texttemplate='%{text:.1f}%',
    textposition='outside'
)

fig2.update_layout(
    uniformtext_minsize=8,
    uniformtext_mode='hide',
    yaxis=dict(range=[0, df_mensual[['Generacion_kWh', 'Consumo_kWh']].values.max() * 1.15])
)

# 4. Modelo Predictivo (Random Forest)
X = df_mensual[['Radiacion_prom', 'Temp_prom']]
y = df_mensual['Generacion_kWh']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
mae = mean_absolute_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

# Gr√°fica del Modelo Predictivo
fig3 = make_subplots(rows=1, cols=2, subplot_titles=('Predicciones vs Reales', 'Residuos del Modelo'))

# Subgr√°fica 1: Predicciones
fig3.add_trace(
    go.Scatter(
        x=y_test,
        y=y_pred,
        mode='markers',
        marker=dict(color=COLOR_PREDICCION, size=10),
        name='Predicciones',
        showlegend=False
    ),
    row=1, col=1
)

fig3.add_trace(
    go.Scatter(
        x=[y_test.min(), y_test.max()],
        y=[y_test.min(), y_test.max()],
        mode='lines',
        line=dict(color='grey', dash='dash'),
        name='L√≠nea Perfecta'
    ),
    row=1, col=1
)

# Subgr√°fica 2: Residuos
residuos = y_test - y_pred
fig3.add_trace(
    go.Scatter(
        x=y_pred,
        y=residuos,
        mode='markers',
        marker=dict(color=COLOR_RESIDUAL, size=10),
        name='Residuos',
        showlegend=False
    ),
    row=1, col=2
)

fig3.add_hline(y=0, line_dash="dash", line_color="grey", row=1, col=2)

fig3.update_layout(
    title_text=f'<b>Modelo Predictivo de Generaci√≥n (MAE: {mae:.0f} kWh | R¬≤: {r2:.2f})</b>',
    showlegend=False,
    template='plotly_white'
)

fig3.update_xaxes(title_text='Valor Real (kWh)', row=1, col=1)
fig3.update_yaxes(title_text='Predicci√≥n (kWh)', row=1, col=1)
fig3.update_xaxes(title_text='Predicci√≥n (kWh)', row=1, col=2)
fig3.update_yaxes(title_text='Residuo (Real - Predicci√≥n)', row=1, col=2)

# Guardar gr√°ficas
if not os.path.exists('graficas'):
    os.makedirs('graficas')

fig1.write_html('graficas/generacion_vs_consumo.html')
fig2.write_html('graficas/comparacion_meses.html')
fig3.write_html('graficas/modelo_predictivo.html')

print("‚úÖ Gr√°ficas generadas exitosamente:")
print(f"1. generacion_vs_consumo.html - Comparaci√≥n mensual con doble eje")
print(f"2. comparacion_meses.html - An√°lisis porcentual por mes")
print(f"3. modelo_predictivo.html - Modelo RF con m√©tricas (MAE: {mae:.0f} kWh, R¬≤: {r2:.2f})")


'M' is deprecated and will be removed in a future version, please use 'ME' instead.



‚úÖ Gr√°ficas generadas exitosamente:
1. generacion_vs_consumo.html - Comparaci√≥n mensual con doble eje
2. comparacion_meses.html - An√°lisis porcentual por mes
3. modelo_predictivo.html - Modelo RF con m√©tricas (MAE: 311 kWh, R¬≤: 0.42)
