# Análisis del Mercado Eléctrico Italiano

## Contexto
Este análisis se basa en un conjunto de datos sobre el mercado eléctrico italiano, disponible en Kaggle. El dataset cubre el periodo de 2012 a 2022 y proporciona información sobre la demanda de electricidad, las fuentes de producción de energía y los precios de la electricidad en Italia. Durante este periodo, Italia ha enfrentado una transición energética debido a cambios en la oferta y la demanda de energía, impulsados por factores como las interrupciones en el suministro de gas, la mayor inversión en energías renovables y las tensiones geopolíticas. Estos cambios son cruciales para comprender las variaciones en la demanda de electricidad.

El objetivo de este análisis es explorar y entender cómo ha evolucionado la demanda eléctrica a lo largo de los años, comparando las distintas regiones del país y realizando predicciones sobre la futura demanda. Este análisis es clave para la optimización de la producción y distribución de energía.

## Archivos del Dataset
El conjunto de datos está compuesto por varios archivos CSV que contienen información específica sobre la producción, la demanda y los precios de la electricidad en Italia. A continuación se describen los archivos y sus características:

1. **`NYMEX_DL_TTF1_1D.csv`** (73.38 KB)
   - **Descripción**: Contiene datos sobre los futuros continuos del gas natural holandés (Dutch Natural Gas Continuous Future), que es relevante para entender los precios de la energía en Europa.
   - **Características**: Datos de precios futuros del gas natural, lo cual puede influir en el precio de la electricidad.

2. **`electricity-prod-source-stacked.csv`** (377.27 KB)
   - **Descripción**: Proporciona información sobre la producción de electricidad en Italia, desglosada por fuente de energía (renovables, fósiles, etc.).
   - **Características**: Contiene la proporción de electricidad generada por cada tipo de fuente de energía, lo que es esencial para comprender cómo varía la oferta de electricidad según las fuentes de energía.

3. **`it_electricity_demand_adj.csv`** (7.94 MB)
   - **Descripción**: Contiene datos ajustados sobre la demanda eléctrica horaria en Italia durante el período cubierto (2012-2022).
   - **Características**: Detalla el consumo de electricidad por hora en diferentes regiones de Italia (por ejemplo, Norte, Sur, Centro-Norte, etc.).

4. **`it_electricity_prices_adj.csv`** (11.97 MB)
   - **Descripción**: Contiene información sobre los precios horarios de la electricidad en Italia, ajustados para reflejar las tendencias económicas.
   - **Características**: Información sobre el precio de la electricidad por megavatio hora (€/MWh), lo que permite observar las fluctuaciones de los precios a lo largo del tiempo.

In [20]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns


# Cargar los datos
demand_df = pd.read_csv('it_electricity_demand_adj.csv')
prices_df = pd.read_csv('it_electricity_prices_adj.csv')
prod_df = pd.read_csv('electricity-prod-source-stacked.csv')
gas_df = pd.read_csv('NYMEX_DL_TTF1 1D.csv')

print(demand_df.head())
print('----------------------------------------------------------------------------------------')
print(demand_df.info())

            Unnamed: 0     Italia      CNOR      CSUD       NORD      SARD  \
0  2012-01-01 01:00:00  24659.161  2662.703  4534.718  11693.113  1460.687   
1  2012-01-01 02:00:00  23387.590  2539.670  4240.313  11113.677  1437.934   
2  2012-01-01 03:00:00  22090.760  2403.112  3927.174  10558.286  1410.237   
3  2012-01-01 04:00:00  21009.116  2267.737  3692.188  10126.168  1379.016   
4  2012-01-01 05:00:00  20350.988  2186.529  3569.043   9851.236  1340.877   

       SICI       SUD  
0  2013.582  2294.358  
1  1926.623  2129.373  
2  1825.260  1966.691  
3  1712.619  1831.388  
4  1627.099  1776.204  
----------------------------------------------------------------------------------------
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 93504 entries, 0 to 93503
Data columns (total 8 columns):
 #   Column      Non-Null Count  Dtype  
---  ------      --------------  -----  
 0   Unnamed: 0  93504 non-null  object 
 1   Italia      93504 non-null  float64
 2   CNOR        93504 non

In [21]:
# Convertir la columna 'Unnamed: 0' a formato de fecha y hora
demand_df['Unnamed: 0'] = pd.to_datetime(demand_df['Unnamed: 0'])

# renombrar la columna "Unnamed" a "datetime"
demand_df = demand_df.rename(columns={'Unnamed: 0': 'Datetime'})

# Verificar la conversión y la estructura de los datos
print(demand_df.head())
print('----------------------------------------------------------------------------------------')
print(demand_df.info())



             Datetime     Italia      CNOR      CSUD       NORD      SARD  \
0 2012-01-01 01:00:00  24659.161  2662.703  4534.718  11693.113  1460.687   
1 2012-01-01 02:00:00  23387.590  2539.670  4240.313  11113.677  1437.934   
2 2012-01-01 03:00:00  22090.760  2403.112  3927.174  10558.286  1410.237   
3 2012-01-01 04:00:00  21009.116  2267.737  3692.188  10126.168  1379.016   
4 2012-01-01 05:00:00  20350.988  2186.529  3569.043   9851.236  1340.877   

       SICI       SUD  
0  2013.582  2294.358  
1  1926.623  2129.373  
2  1825.260  1966.691  
3  1712.619  1831.388  
4  1627.099  1776.204  
----------------------------------------------------------------------------------------
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 93504 entries, 0 to 93503
Data columns (total 8 columns):
 #   Column    Non-Null Count  Dtype         
---  ------    --------------  -----         
 0   Datetime  93504 non-null  datetime64[ns]
 1   Italia    93504 non-null  float64       
 2   CNOR   

In [22]:
# Comprobar si hay valores nulos
print('VALORES NULOS:')
print(demand_df.isnull().sum())

VALORES NULOS:
Datetime    0
Italia      0
CNOR        0
CSUD        0
NORD        0
SARD        0
SICI        0
SUD         0
dtype: int64
