![image.png](attachment:image.png) 

[SiMEM](https://www.simem.co/)

## Objetivos de este Notebook

* Explicar cómo se puede consultar el catálogo de conjuntos de datos que se publican en SiMEM.
* Explicar cómo consultar la información de un conjunto de datos determinado.
* Demostrar cómo hacer filtros especializados en un conjunto de datos determinado.

### Carga del objeto PyDataSimem

En la siguiente celda se importa el objeto PyDataSimem, que contiene el método para consultar los conjuntos de datos de SiMEM

In [1]:
import sys
import os
sys.path.append(os.path.abspath('..\src'))
from pydatasimem import PyDataSimem

objeto = PyDataSimem()

### Importacion de librerías

In [2]:
import pandas as pd
import datetime as dt

### Consulta para obtener el catálogo de conjuntos de datos

El catálogo de conjuntos de datos de SiMEM es un conjunto de datos también, por lo tanto cuenta con un DatasetID, el cual es e007fb.

Se hace la consulta para la fecha de hoy

In [3]:
fecha_hoy = dt.datetime.strftime(dt.date.today() - dt.timedelta(days=1),'%Y-%m-%d')
dataset_id = 'e007fb'

In [4]:
df_catalogo = objeto.main(dataset_id, start_date=fecha_hoy, end_date=fecha_hoy)
df_catalogo.head()

Unnamed: 0,idDataset,nombreConjuntoDatos,fechaPublicacion,fechaActualizacion,inicioDato,finDato,fechaDescarga,urlConexionAPI,urlConjuntoDatos,tipoPublicacion
0,ADE905,Panorama energético Corto Plazo Generación,2023-11-28T12:07:03.03,2024-05-05T19:17:51.437,2023-10-02T00:00:00,2024-05-12T00:00:00,,https://www.simem.co/backend-files/api/PublicD...,https://www.simem.co/datadetail/ade905f7-cb05-...,Público
1,a704ee,Datos soporte del proceso de liquidación por C...,2023-09-28T21:28:06.433,2024-05-06T23:18:50.38,2017-12-01T00:00:00,2024-04-01T00:00:00,2024-02-06T11:57:58.247,https://www.simem.co/backend-files/api/PublicD...,https://www.simem.co/datadetail/a704eef3-ca1c-...,Público
2,d808d4,Energía de Referencia para el Mercado Secundario,2023-09-29T11:01:54.317,2024-05-07T09:45:35.76,2018-12-01T00:00:00,2050-11-30T00:00:00,2024-04-22T14:58:19.537,https://www.simem.co/backend-files/api/PublicD...,https://www.simem.co/datadetail/d808d43d-e3da-...,Público
3,2106b8,Precios y estadísticas de los contratos de con...,2023-09-30T10:35:01.19,2024-05-05T06:27:33.627,2020-10-01T00:00:00,2024-04-01T00:00:00,,https://www.simem.co/backend-files/api/PublicD...,https://www.simem.co/datadetail/99686983-57a4-...,Público
4,F3A83B,Estadísticas de contratos de Demanda Desconect...,2023-09-30T11:09:06.763,2024-05-07T08:16:51.923,2022-12-01T00:00:00,2024-05-01T00:00:00,2024-05-06T11:54:57.203,https://www.simem.co/backend-files/api/PublicD...,https://www.simem.co/datadetail/f3a83baa-a370-...,Público


Aquí se obtienen todos los conjuntos de datos disponibles en SiMEM, las columnas se leen de la siguiente manera:
 
* **idDataset**: Identificador único del conjunto de datos, es el que se utiliza en el objeto PyDataSimem para consultar la información.
* **nombreConjuntoDatos**: Nombre con el que se encuentra el conjunto de datos en el portal.
* **fechaPublicacion**: Indica desde cuando existe el el conjunto de datos en SIMEM
* **fechaActualizacion**: Indica la ultima vez que se actualizó el conjunto de datos
* **inicioDato**: Indica desde qué fecha contiene información el conjunto de datos
* **finDato**: Indica hasta cuando contiene información el conjunto de datos
* **fechaDescarga**: Indica la fecha y hora de la ultima descarga del conjunto de datos
* **urlConexionAPI**: URL para la conexión a la API
* **urlConjuntoDatos**: URL para la conexión en el portal SIMEM
* **tipoPublicacion**: 	Privacidad del conjunto de datos

### Consultar información de un conjunto de datos

Para el ejemplo, se desea consultar la información de la Generación Real del SIN entre la fecha 2024-04-01 y la fecha 2024-04-07. Para esto, buscamos en el catálogo de datos el Dataset ID correspondiente

In [5]:
df_catalogo.query("nombreConjuntoDatos.str.contains('Generación Real')")

Unnamed: 0,idDataset,nombreConjuntoDatos,fechaPublicacion,fechaActualizacion,inicioDato,finDato,fechaDescarga,urlConexionAPI,urlConjuntoDatos,tipoPublicacion
208,E17D25,Generación Real y Programada en las Plantas de...,2023-09-29T10:59:40.38,2024-05-07T08:16:20.267,2013-01-01T00:00:00,2024-05-05T00:00:00,2024-04-26T17:46:58.05,https://www.simem.co/backend-files/api/PublicD...,https://www.simem.co/datadetail/e17d259d-ffba-...,Público


Ahora, se definen los parámetros de entrada y se hace la búsqueda de la información.

In [6]:
dataset_id = 'E17D25'
fecha_inicio = '2024-04-01'
fecha_fin = '2024-04-07'

In [8]:
df_genreal = objeto.main(dataset_id, fecha_inicio, fecha_fin)
df_genreal.head(10)

Unnamed: 0,Fecha,CodigoPlanta,TipoGeneracion,TipoClasificacion,TipoDespachoRecurso,GeneracionRealEstimada,GeneracionProgramadaDespacho,GeneracionProgramadaRedespacho
0,2024-04-07,LBR1,Hidraulica,Hidraulica,No Despachado Centralmente,55929.769531,48000.0,48000
1,2024-04-07,SBA1,Hidraulica,Hidraulica,No Despachado Centralmente,38134.730469,40800.0,40800
2,2024-04-07,FLRD,Hidraulica,Hidraulica,No Despachado Centralmente,211840.0,186000.0,186000
3,2024-04-07,COE1,Hidraulica,Hidraulica,No Despachado Centralmente,13990.049805,26400.0,26400
4,2024-04-07,LPLO,Hidraulica,Hidraulica,No Despachado Centralmente,20918.439453,19200.0,19200
5,2024-04-07,GCA1,Hidraulica,Hidraulica,No Despachado Centralmente,0.0,84000.0,84000
6,2024-04-07,ALTG,Hidraulica,Hidraulica,No Despachado Centralmente,146799.4375,184000.0,184000
7,2024-04-07,3HDG,Hidraulica,Hidraulica,No Despachado Centralmente,218527.65625,412200.0,412200
8,2024-04-07,2QBW,Hidraulica,Hidraulica,No Despachado Centralmente,277185.84375,370000.0,370000
9,2024-04-07,SPY1,Hidraulica,Hidraulica,No Despachado Centralmente,38955.0,36000.0,36000


### Analizar la información consultada

De acuerdo con la información que entrega el conjunto de datos de generación real, es posible obtener información, por ejemplo, de cuánto fue la generación real por tipo de generación para cada día de la consulta.

In [11]:
df_genreal.groupby(['Fecha','TipoGeneracion'])['GeneracionRealEstimada'].sum().reset_index()

Unnamed: 0,Fecha,TipoGeneracion,GeneracionRealEstimada
0,2024-04-01,Cogenerador,2214651.0
1,2024-04-01,Eolica,433633.2
2,2024-04-01,Hidraulica,117223700.0
3,2024-04-01,Solar,9861245.0
4,2024-04-01,Termica,102393700.0
5,2024-04-02,Cogenerador,2160171.0
6,2024-04-02,Eolica,443939.1
7,2024-04-02,Hidraulica,117813500.0
8,2024-04-02,Solar,7857761.0
9,2024-04-02,Termica,101571800.0
