# E5. Manipulación y análisis de datos de energía
Este notebook analiza un dataset de consumo energético en W a lo largo de 365 días.
El objetivo es realizar un análisis estadístico y una visualización sencilla usando `pandas` y `matplotlib`.

In [None]:
# Importar las librerías necesarias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [None]:
# Cargar el dataset desde un archivo CSV
url = 'data/m1_e5_datos_energia.csv'  # Cambiar por la ruta local si es necesario
df = pd.read_csv(url)
# Convertimos el campo 'Fecha' a un objeto de tipo datetime (fecha)
df['Fecha'] = pd.to_datetime(df['Fecha'])
# Fijamos 'Fecha' com índice
df = df.set_index('Fecha')
df.head()

In [None]:
# Información del conjunto de datos cargado
df.info()

## Estadísticas Descriptivas
Vamos a calcular las estadísticas básicas del consumo de energía y costo.

In [None]:
# Calcular estadísticas descriptivas
df.describe()

## Visualización de los datos
A continuación, visualizamos el consumo de energía diario a lo largo del tiempo.

In [None]:
# Crear una gráfica de consumo de energía
plt.figure(figsize=(10, 6))
plt.plot(df.index, df['Consumo'], marker='o')
plt.title('Consumos Diarios de Energía')
plt.xlabel('Fecha')
plt.ylabel('Energy Consumption (kWh)')
plt.grid(True)
plt.xticks(rotation=45)
plt.show()

#### Filtrado de datos
Seleccionamos un rango mas reducido de datos para su análisis

In [None]:
# Filtramos datos del primer trimestre
t1_df = df[df.index.month < 4]
# Crear una gráfica de consumo de energía
plt.figure(figsize=(10, 6))
plt.plot(t1_df.index, t1_df['Consumo'], marker='o')
plt.title('Consumos Diarios de Energía')
plt.xlabel('Fecha')
plt.ylabel('Potencia Promedio (kW)')
plt.grid(True)
plt.xticks(rotation=45)
plt.show()

### Carga de otros datos y filtrado
Ahora cargaremos otro conjunto de datos de consumos de un edificio de oficina en el mismo rango

In [None]:
url = 'data/m1_e5_datos_energia_oficina.csv'  # Cambiar por la ruta local si es necesario
oficina_df = pd.read_csv(url)
# Convertimos el campo 'Fecha' a un objeto de tipo datetime (fecha)
oficina_df['Fecha'] = pd.to_datetime(oficina_df['Fecha'])
# Fijamos 'Fecha' com índice
oficina_df = oficina_df.set_index('Fecha')
oficina_df.head()

In [None]:
# Filtramos datos del primer trimestre
oficina_t1_df = oficina_df[oficina_df.index.month < 4]
# Crear una gráfica de consumo de energía
plt.figure(figsize=(10, 6))
plt.plot(oficina_t1_df.index, oficina_t1_df['Consumo'], marker='o')
plt.xticks(ticks=oficina_t1_df.index[::len(oficina_t1_df) // 12], labels=oficina_t1_df.index[::len(oficina_t1_df) // 12], rotation=45)
plt.title('Consumos Diarios de Energía')
plt.xlabel('Fecha')
plt.ylabel('Potencia Promedio (kW)')
plt.grid(True)
plt.xticks(rotation=45)
plt.show()

### Combinación de datos de diferente fuentes

In [None]:
# Renombrar columnas para diferenciarlas
a_df = t1_df.rename(columns={
    "Consumo": "Consumo_A",
    "Consumo_Minimo": "Consumo_Minimo_A",
    "Consumo_Maximo": "Consumo_Maximo_A"
}, inplace=False)

b_df = oficina_t1_df.rename(columns={
    "Consumo": "Consumo_B",
    "Consumo_Minimo": "Consumo_Minimo_B",
    "Consumo_Maximo": "Consumo_Maximo_B"
}, inplace=False)

# Combinar los DataFrames por su índice (Fecha)
df_combined = pd.merge(a_df, b_df, left_index=True, right_index=True, how="inner")

# Mostrar el DataFrame combinado
print("\nDataFrame Combinado:")
print(df_combined.head())

# Graficar las columnas combinadas
plt.figure(figsize=(10, 6))
plt.plot(df_combined.index, df_combined["Consumo_A"], label="Consumo A", marker='o')
plt.plot(df_combined.index, df_combined["Consumo_B"], label="Consumo B", marker='o')

# Personalizar el gráfico
plt.title("Comparación de Consumos")
plt.xlabel("Fecha")
plt.ylabel("Consumo (kWh)")
plt.legend()
plt.grid(True)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()