# EXTRACCIÓN Y PREPROCESAMIENTO INICIAL DE LOS DATOS

## EXTRACCIÓN DATOS DEMANDA ELÉCTRICA

In [2]:
import requests
import datetime
import pandas as pd
from matplotlib import pyplot as plt
from pyesios import ESIOS

Usando el programa Pyesios basado en una librería pública, se crea un programa que extrae los datos de un año de la API de REE.

In [6]:
import datetime
import pandas as pd
from matplotlib import pyplot as plt
from pyesios import ESIOS

def get_annual_mean_daily_demand(esios, indicator_id, year):
    """
    Obtiene la demanda media diaria para un año específico.
    :param esios: instancia de la clase ESIOS.
    :param indicator_id: ID del indicador.
    :param year: año para el cual obtener los datos.
    :return: DataFrame con la demanda media diaria para todo el año.
    """
    months = [datetime.datetime(year, m, 1) for m in range(1, 13)]
    df_list = []
    
    for i in range(len(months)):
        start_ = months[i]
        # Para el último mes, el end_ debe ser el último día del mes
        if i < len(months) - 1:
            end_ = months[i + 1] - datetime.timedelta(days=1)
        else:
            end_ = datetime.datetime(year, 12, 31)  # Último día del año
        
        print(f"Obteniendo datos de {start_.strftime('%Y-%m-%d')} a {end_.strftime('%Y-%m-%d')}")
        
        try:
            df_chunk, names = esios.get_multiple_series([indicator_id], start_, end_)
            if df_chunk:
                # Asegurarse de que df_chunk es una lista de DataFrames
                for df in df_chunk:
                    df_list.append(df)
        except Exception as e:
            print(f"Error al obtener datos para {start_} a {end_}: {e}")
    
    if df_list:
        df_full = pd.concat(df_list)
        # Asegurarse de que el índice sea un DatetimeIndex
        df_full.index = pd.to_datetime(df_full.index)
        # Resamplear los datos para obtener el valor medio diario
        df_mean_daily = df_full.resample('D').mean()
        return df_mean_daily
    else:
        raise ValueError("No se obtuvieron datos.")

#if __name__ == "__main__":
#    # Token de autenticación
#    token = "730e1f70b436f435a417b590c31554a891c4348a9bc8927e2e3395bab2e560b7"
#    esios = ESIOS(token)

    # Año para el cual obtener los datos
#    year = 2022
#   indicator_id = 1293  # Demanda real

    # Obtener la demanda media diaria para el año especificado
#   df_mean_daily = get_annual_mean_daily_demand(esios, indicator_id, year)

    # Mostrar los primeros resultados
#   print(df_mean_daily.head())

    # Gráfico de la demanda media diaria para el año especificado
#    fig, ax1 = plt.subplots()
#   df_mean_daily.plot(ax=ax1)
#    ax1.set_xlabel("Fecha")
#    ax1.set_ylabel("Demanda media diaria (MW)")
#    ax1.set_title(f"Demanda Media Diaria en {year}")

#    plt.show()


Extracción de los datos para todos los años necesarios y copia en CSV.

In [3]:
if __name__ == "__main__":
    # Token de autenticación
    token = "730e1f70b436f435a417b590c31554a891c4348a9bc8927e2e3395bab2e560b7"
    esios = ESIOS(token)

    # Lista de años para los cuales obtener los datos
    años = [2019, 2020, 2021, 2022, 2023, 2024]
    indicator_id = 1293  # Demanda real
    
    # Lista para almacenar los DataFrames
    dfs = []

    for año in años:
        print(f"Procesando datos para el año {año}")
        try:
            df_mean_daily = get_annual_mean_daily_demand(esios, indicator_id, año)
            df_mean_daily['Año'] = año  # Añadir una columna con el año para identificar los datos
            dfs.append(df_mean_daily)
        except ValueError as e:
            print(f"No se pudieron obtener datos para el año {año}: {e}")

    if dfs:
        # Concatenar todos los DataFrames en uno solo
        datos_completos = pd.concat(dfs, ignore_index=False)
        # Guardar el DataFrame completo en un archivo CSV
        datos_completos.to_csv('datos_demanda_media_diaria.csv', index=True)
        print("Datos extraídos y guardados en 'datos_demanda_media_diaria.csv'")
    else:
        print("No se extrajeron datos.")

Getting the indicators...
Procesando datos para el año 2019
Obteniendo datos de 2019-01-01 a 2019-01-31
Parsing Demanda real
Obteniendo datos de 2019-02-01 a 2019-02-28
Parsing Demanda real
Obteniendo datos de 2019-03-01 a 2019-03-31
Parsing Demanda real
Obteniendo datos de 2019-04-01 a 2019-04-30
Parsing Demanda real
Obteniendo datos de 2019-05-01 a 2019-05-31
Parsing Demanda real
Obteniendo datos de 2019-06-01 a 2019-06-30
Parsing Demanda real
Obteniendo datos de 2019-07-01 a 2019-07-31
Parsing Demanda real
Obteniendo datos de 2019-08-01 a 2019-08-31
Parsing Demanda real
Obteniendo datos de 2019-09-01 a 2019-09-30
Parsing Demanda real
Obteniendo datos de 2019-10-01 a 2019-10-31
Parsing Demanda real
Obteniendo datos de 2019-11-01 a 2019-11-30
Parsing Demanda real
Obteniendo datos de 2019-12-01 a 2019-12-31
Parsing Demanda real
Procesando datos para el año 2020
Obteniendo datos de 2020-01-01 a 2020-01-31
Parsing Demanda real
Obteniendo datos de 2020-02-01 a 2020-02-29
Parsing Demanda r