# Análisis del Mercado Eléctrico Italiano

## Contexto
Este análisis se basa en un conjunto de datos sobre el mercado eléctrico italiano, disponible en Kaggle. El dataset cubre el periodo de 2012 a 2022 y proporciona información sobre la demanda de electricidad, las fuentes de producción de energía y los precios de la electricidad en Italia. Durante este periodo, Italia ha enfrentado una transición energética debido a cambios en la oferta y la demanda de energía, impulsados por factores como las interrupciones en el suministro de gas, la mayor inversión en energías renovables y las tensiones geopolíticas. Estos cambios son cruciales para comprender las variaciones en la demanda de electricidad.

El objetivo de este análisis es explorar y entender cómo ha evolucionado la demanda eléctrica a lo largo de los años, comparando las distintas regiones del país y realizando predicciones sobre la futura demanda. Este análisis es clave para la optimización de la producción y distribución de energía.

## Archivos del Dataset
El conjunto de datos está compuesto por varios archivos CSV que contienen información específica sobre la producción, la demanda y los precios de la electricidad en Italia. A continuación se describen los archivos y sus características:

1. **`NYMEX_DL_TTF1_1D.csv`** (73.38 KB)
   - **Descripción**: Contiene datos sobre los futuros continuos del gas natural holandés (Dutch Natural Gas Continuous Future), que es relevante para entender los precios de la energía en Europa.
   - **Características**: Datos de precios futuros del gas natural, lo cual puede influir en el precio de la electricidad.

2. **`electricity-prod-source-stacked.csv`** (377.27 KB)
   - **Descripción**: Proporciona información sobre la producción de electricidad en Italia, desglosada por fuente de energía (renovables, fósiles, etc.).
   - **Características**: Contiene la proporción de electricidad generada por cada tipo de fuente de energía, lo que es esencial para comprender cómo varía la oferta de electricidad según las fuentes de energía.

3. **`it_electricity_demand_adj.csv`** (7.94 MB)
   - **Descripción**: Contiene datos ajustados sobre la demanda eléctrica horaria en Italia durante el período cubierto (2012-2022).
   - **Características**: Detalla el consumo de electricidad por hora en diferentes regiones de Italia (por ejemplo, Norte, Sur, Centro-Norte, etc.).

4. **`it_electricity_prices_adj.csv`** (11.97 MB)
   - **Descripción**: Contiene información sobre los precios horarios de la electricidad en Italia, ajustados para reflejar las tendencias económicas.
   - **Características**: Información sobre el precio de la electricidad por megavatio hora (€/MWh), lo que permite observar las fluctuaciones de los precios a lo largo del tiempo.

In [2]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns


# Cargar los datos
demand_df = pd.read_csv('it_electricity_demand_adj.csv')
prices_df = pd.read_csv('it_electricity_prices_adj.csv')
prod_df = pd.read_csv('electricity-prod-source-stacked.csv')
gas_df = pd.read_csv('NYMEX_DL_TTF1 1D.csv')

print(demand_df.head())
print('----------------------------------------------------------------------------------------')
print(demand_df.info())

            Unnamed: 0     Italia      CNOR      CSUD       NORD      SARD  \
0  2012-01-01 01:00:00  24659.161  2662.703  4534.718  11693.113  1460.687   
1  2012-01-01 02:00:00  23387.590  2539.670  4240.313  11113.677  1437.934   
2  2012-01-01 03:00:00  22090.760  2403.112  3927.174  10558.286  1410.237   
3  2012-01-01 04:00:00  21009.116  2267.737  3692.188  10126.168  1379.016   
4  2012-01-01 05:00:00  20350.988  2186.529  3569.043   9851.236  1340.877   

       SICI       SUD  
0  2013.582  2294.358  
1  1926.623  2129.373  
2  1825.260  1966.691  
3  1712.619  1831.388  
4  1627.099  1776.204  
----------------------------------------------------------------------------------------
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 93504 entries, 0 to 93503
Data columns (total 8 columns):
 #   Column      Non-Null Count  Dtype  
---  ------      --------------  -----  
 0   Unnamed: 0  93504 non-null  object 
 1   Italia      93504 non-null  float64
 2   CNOR        93504 non

In [3]:
# Convertir la columna 'Unnamed: 0' a formato de fecha y hora
demand_df['Unnamed: 0'] = pd.to_datetime(demand_df['Unnamed: 0'])

# renombrar la columna "Unnamed" a "datetime"
demand_df = demand_df.rename(columns={'Unnamed: 0': 'Datetime'})

# Verificar la conversión y la estructura de los datos
print(demand_df.head())
print('----------------------------------------------------------------------------------------')
print(demand_df.info())



             Datetime     Italia      CNOR      CSUD       NORD      SARD  \
0 2012-01-01 01:00:00  24659.161  2662.703  4534.718  11693.113  1460.687   
1 2012-01-01 02:00:00  23387.590  2539.670  4240.313  11113.677  1437.934   
2 2012-01-01 03:00:00  22090.760  2403.112  3927.174  10558.286  1410.237   
3 2012-01-01 04:00:00  21009.116  2267.737  3692.188  10126.168  1379.016   
4 2012-01-01 05:00:00  20350.988  2186.529  3569.043   9851.236  1340.877   

       SICI       SUD  
0  2013.582  2294.358  
1  1926.623  2129.373  
2  1825.260  1966.691  
3  1712.619  1831.388  
4  1627.099  1776.204  
----------------------------------------------------------------------------------------
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 93504 entries, 0 to 93503
Data columns (total 8 columns):
 #   Column    Non-Null Count  Dtype         
---  ------    --------------  -----         
 0   Datetime  93504 non-null  datetime64[ns]
 1   Italia    93504 non-null  float64       
 2   CNOR   

In [4]:
# Comprobar si hay valores nulos
print('VALORES NULOS:')
print(demand_df.isnull().sum())
print('-----------------------------------------------------------------------------------')
print(demand_df.describe())

VALORES NULOS:
Datetime    0
Italia      0
CNOR        0
CSUD        0
NORD        0
SARD        0
SICI        0
SUD         0
dtype: int64
-----------------------------------------------------------------------------------
                  Datetime        Italia          CNOR          CSUD  \
count                93504  93504.000000  93504.000000  93504.000000   
mean   2017-05-02 00:30:00  32519.967098   3287.953532   5247.286205   
min    2012-01-01 01:00:00  16272.977000   1550.070000   2580.443000   
25%    2014-09-01 00:45:00  26502.196750   2643.802000   4318.080750   
50%    2017-05-02 00:30:00  32016.382500   3224.852000   5258.185500   
75%    2020-01-01 00:15:00  38450.967750   3913.896750   6099.085000   
max    2022-09-01 00:00:00  50393.780000   6007.450000   8899.763000   
std                    NaN   6818.933965    791.864286   1128.337246   

               NORD          SARD          SICI           SUD  
count  93504.000000  93504.000000  93504.000000  93504.000000  

In [None]:
demand_df['year'] = demand_df['Datetime'].dt.year

print(demand_df)


                 Datetime     Italia      CNOR      CSUD       NORD      SARD  \
0     2012-01-01 01:00:00  24659.161  2662.703  4534.718  11693.113  1460.687   
1     2012-01-01 02:00:00  23387.590  2539.670  4240.313  11113.677  1437.934   
2     2012-01-01 03:00:00  22090.760  2403.112  3927.174  10558.286  1410.237   
3     2012-01-01 04:00:00  21009.116  2267.737  3692.188  10126.168  1379.016   
4     2012-01-01 05:00:00  20350.988  2186.529  3569.043   9851.236  1340.877   
...                   ...        ...       ...       ...        ...       ...   
93499 2022-08-31 20:00:00  39234.945  3450.666  6835.219  21600.813  1233.899   
93500 2022-08-31 21:00:00  39005.320  3417.592  6790.829  21280.509  1260.336   
93501 2022-08-31 22:00:00  38956.535  3358.284  6855.084  20964.329  1305.351   
93502 2022-08-31 23:00:00  37077.835  3172.588  6478.296  20155.819  1250.641   
93503 2022-09-01 00:00:00  34155.930  2868.968  5940.663  18603.728  1162.996   

           SICI       SUD  

In [10]:
demand_por_zona_por_anio = demand_df.groupby(['year']).agg({
    'Italia': 'sum',  # Sumar la columna 'Italia'
    'CNOR': 'sum',    # Sumar la columna 'CNOR'
    'CSUD': 'sum',    # Sumar la columna 'CSUD'
    'NORD': 'sum',    # Sumar la columna 'NORD'
    'SARD': 'sum',    # Sumar la columna 'SARD'
    'SICI': 'sum',    # Sumar la columna 'SICI'
    'SUD': 'sum'
}).reset_index()

print(demand_por_zona_por_anio)

    year        Italia          CNOR          CSUD          NORD  \
0   2012  2.945348e+08  3.157968e+07  4.767508e+07  1.577065e+08   
1   2013  2.852032e+08  2.851774e+07  4.433649e+07  1.564274e+08   
2   2014  2.784616e+08  2.586894e+07  4.064183e+07  1.565127e+08   
3   2015  2.826228e+08  2.811454e+07  4.497811e+07  1.558118e+08   
4   2016  2.822920e+08  2.985886e+07  4.615561e+07  1.552723e+08   
5   2017  2.860419e+08  3.124860e+07  4.657017e+07  1.591522e+08   
6   2018  2.917606e+08  3.108157e+07  4.594104e+07  1.644496e+08   
7   2019  2.889769e+08  3.095200e+07  4.574050e+07  1.620192e+08   
8   2020  2.715093e+08  2.890833e+07  4.384289e+07  1.507080e+08   
9   2021  2.860881e+08  2.457109e+07  5.061676e+07  1.609361e+08   
10  2022  1.932558e+08  1.673546e+07  3.414375e+07  1.082007e+08   

            SARD          SICI           SUD  
0   1.263108e+07  1.991133e+07  2.503108e+07  
1   1.089503e+07  1.932450e+07  2.570209e+07  
2   1.141631e+07  1.804945e+07  2.597243e+