---
### Universidad de Costa Rica
#### IE0405 - Modelos Probabilísticos de Señales y Sistemas

Primer ciclo del 2023

---

[comment]: <> (Modificar esta sección con datos personales)

* Estudiante: **Nombre completo de estudiante**
* Carné: **D12345**
* Grupo: **1/2/3**

# `P3` - *Variables aleatorias múltiples*

> Este es un ejercicio de análisis y modelado probabilístico de variables aleatorias múltiples con las herramientas de programación y cálculo numérico de Python.

**Nota**: Es recomendable revisar el tutorial `Py6` (disponible en [GitHub](https://github.com/fabianabarca/python)) para conocer las bases de Python útiles en la ejecución de este laboratorio.

---

---
## Problema

El Instituto Costarricense de Electricidad (ICE), por medio del Centro Nacional de Control de la Energía (CENCE), publica los datos de consumo de potencia del Sistema Eléctrico Nacional (SEN) por medio de *servicios web* (API) de acceso libre y gratuito.

Entre las posibles solicitudes de datos está la información de consumo diario de potencia, registrado hora a hora para un periodo particular, que puede ser obtenida en formato JSON, y luce de la siguiente forma:

```json
{
  "descripcion": "Consulta que devuelve la curva de demanda en un tiempo definido.",
  "fechaConsulta": "2022-10-06T10:11 -0600",
  "data": [
    {
      "fechaHora": "2019-01-01 00:00:00.0",
      "MW": 958.05,
      "MW_P": 937.6
    },
    {
      "fechaHora": "2019-01-01 01:00:00.0",
      "MW": 917.04,
      "MW_P": 876.01
    },
    {
      "fechaHora": "2019-01-01 02:00:00.0",
      "MW": 856.19,
      "MW_P": 830.11
    },
    ...
    {
      "fechaHora": "2019-12-31 23:00:00.0",
      "MW": 1056.74,
      "MW_P": 1018.2
    },
    {
      "fechaHora": "2020-01-01 00:00:00.0",
      "MW": 978.31,
      "MW_P": 919
    }
  ],
  "_links": {
    "next": null,
    "previous": null,
    "self": "https://apps.grupoice.com/CenceWeb/data/sen/json/DemandaMW?inicio=20190101&fin=20200101"
  },
  "fuente": "Centro Nacional de Control de Energía. Instituto Costarricense de Electricidad - CENCE.",
  "nombreConsulta": "DemandaMW"
}
```

**Nota**: El uso de los servicios disponibles está documentado en la página [Guía del sistema proveedor de Servicios Web del CENCE](https://apps.grupoice.com/CenceWeb/paginas/GuiaServiciosWeb.html#ejemplos).


### Objetivos

Este proyecto tiene el objetivo de determinar lo siguiente:

1. Un modelo de la distribución de consumo de potencia para *una hora particular del día*.
1. Una comparación entre las distribuciones de consumo de potencia de *dos horas particulares del día*, por medio del cálculo numérico de una correlación y una visualización conjunta.

Para esto es necesario entregar:

- Un "script" en un documento `[carné].py` que ejecuta el proyecto, con:
    - Funciones que realizan las tareas solicitadas.
    - Documentación para cada función, siguiendo las convenciones de `docstrings`.
    - Resultados como texto en la terminal y como imágenes.
- Un documento `requirements.txt` con los paquetes requeridos para la ejecución del código `[carné].py` en un ambiente virtual.
    - Hay un documento de ejemplo pero debe agregar cualquier nuevo paquete necesario para la ejecución del código.

### Asignaciones

El documento `demandaMW_2021.json` tiene el consumo de potencia medido hora a hora del año 2019 en Costa Rica.

1. (20 %) Implemente una función `datos_hora()` capaz de obtener los datos de consumo de potencia de una hora particular (0 - 24) a lo largo de todo el período de días disponible. Ejemplo: los datos del consumo de potencia (MW) para las 18:00 horas en 365 días.
1. (20 %) Implemente una función `modelo_hora()` capaz de determinar un modelo probabilístico y sus parámetros de mejor ajuste para la distribución de consumo de potencia de una hora particular (0 - 24) a lo largo de todo el período de días disponible. Ejemplo: el modelo de distribución del consumo de potencia (MW) para las 18:00 horas en 365 días.
1. (20 %) Implemente una función `visualizacion_hora()` capaz de graficar el histograma de distribución de consumo de potencia de una hora particular (0 - 24) a lo largo de todo el período de días disponible. Ejemplo: la distribución de probabilidad del consumo de potencia (MW) para las 18:00 horas en 365 días.
1. (20 %) Implemente una función `correlacion_horas()` capaz de determinar el coeficiente de correlación entre dos horas particulares (0 - 24) a lo largo de todo el período de días disponible. Ejemplo: coeficiente de correlación $\rho$ entre las 18:00 horas y las 23:00 horas.
1. (20 %) Implemente una función `visualizacion_horas()` capaz de graficar el histograma *bivariado* de distribución de consumo de potencia de *dos horas particulares* (0 - 24) a lo largo de todo el período de días disponible. Ejemplo: la distribución del consumo de potencia (MW) para las 18:00 horas y las 23:00 horas en 365 días, en una gráfica tridimensional.

#### Penalizaciones

- Si el código no corre, pierde la totalidad de los puntos del proyecto.
- Si el código no muestra el resultado correcto de una asignación o no indica cuál es la asignación a la que corresponde ese resultado, pierde los puntos de la asignación.
- La penalización por errores de escritura de código o documentación es de 5\% por cada error encontrado, hasta un máximo de 50\% de la nota del proyecto.

> Ver información a continuación sobre el modo de revisión del proyecto.

## Creación de un ambiente virtual

Las diferencias en las versiones de los paquetes utilizados para un código en Python pueden provocar resultados distintos al ser ejecutados en distintas computadoras, o inclusive no funcionar del todo (lo que en este proyecto causaría la pérdida de los puntos). Es necesario recordar que los paquetes pueden tener cambios radicales de clases, funciones, métodos, atributos y otros componentes que los hacen incompatibles entre versiones. Una persona que desarrolla un código no tiene control sobre los paquetes que hay en las computadoras de los usuarios.

Esta es una situación usual:

<img src="https://pbs.twimg.com/media/FdL6s1YXgAEweIX?format=png&name=900x900" width="300px">

Una forma de reducir este riesgo es utilizar un [ambiente virtual de Python](https://docs.python.org/es/3.8/library/venv.html) que crea un espacio con un directorio aislado del resto del sistema y con los paquetes específicos para la ejecución del script creado.

Para crear un ambiente virtual llamado, por ejemplo, `proyecto3`, seguimos los siguientes pasos en la terminal, con la ayuda del módulo `venv` de Python:

1. Primero crear el ambiente virtual

```bash
$ python -m venv proyecto3
```

Más específicamente: `python3 -m venv /path/to/new/virtual/environment`.

2. Ahora hay que "activar" el ambiente virtual

Esto cambia según sistema operativo:

- Windows: `proyecto3\Scripts\activate`
- Linux/macOS: `source proyecto3/bin/activate`

Con esto aparecerá un cambio en el *prompt*, similar a:

```bash
(proyecto3) $
```

que indica que estamos dentro del ambiente virtual.

3. Seguidamente instalamos los paquetes necesarios para operar en este ambiente virtual.

Si ejecuta `pip list` notará que hay una mínima cantidad de paquetes, algo como:

```
Package    Version
---------- -------
pip        22.0.4
setuptools 58.1.0
```

Utilizando `pip install <paquete>` puede instalar uno por uno los paquetes necesarios. Sin embargo, es más práctico y común utilizar una lista de requisitos de paquetes en un archivo `requirements.txt` como este:

```
numpy>=1.16.5
scipy==1.7.3
pandas==2.0.1
matplotlib==3.5.1
pycodestyle==2.10.0
pydocstyle==6.3.0
```

Entonces es necesario proceder con su instalación en el ambiente virtual de la forma:

```bash
(proyecto3) $ pip install -r requirements.txt
```

Luego de que se hace la instalación, nuevamente comprobamos los paquetes con `pip list`, que resulta en, por ejemplo:

```
Package         Version
--------------- -------
cycler          0.11.0
fonttools       4.39.4
kiwisolver      1.4.4
matplotlib      3.5.1
numpy           1.22.4
packaging       23.1
pandas          2.0.1
Pillow          9.5.0
pip             22.0.4
pycodestyle     2.10.0
pydocstyle      6.3.0
pyparsing       3.0.9
python-dateutil 2.8.2
pytz            2023.3
scipy           1.7.3
setuptools      58.1.0
six             1.16.0
snowballstemmer 2.2.0
tzdata          2023.3
```

Todos los paquetes instalados que no estaban indicados en `requirements.txt` son dependencias necesarias para los que sí estaban.

## Metodología de revisión del proyecto

Para la revisión seguiremos estrictamente el siguiente procedimiento. Dados un archivo `B12345.py`, por ejemplo, y otro `requirements.txt` entregados por cada estudiante, entonces la revisión será:

```bash
(base) .../B12345 $ python -m venv B12345
(base) .../B12345 $ source B12345/bin/activate
(B12345) (base) .../B12345 $ pip install -r requirements.txt
(B12345) (base) .../B12345 $ pycodestyle --count B12345.py
(B12345) (base) .../B12345 $ pydocstyle --convention=numpy --count B12345.py
(B12345) (base) .../B12345 $ python B12345.py
```

en donde `(B12345)` indica que estamos dentro del ambiente virtual llamado B12345, `.../B12345` es el directorio en el que nos encontramos y `$` es un *prompt* de la terminal. Cada instrucción es:

- `python -m venv B12345` crea el ambiente virtual
- `source B12345/bin/activate` lo activa
- `pip install -r requirements.txt` instala los paquetes requeridos
- `pycodestyle --count B12345.py` revisa PEP-8 y cuenta los errores encontrados
- `pydocstyle --count --convention=numpy B12345.py` revisa PEP-257 (*docstrings*) y cuenta los errores encontrados según la convención de NumPy 
- `python B12345.py` ejecuta el código

### Revisión de escritura del código y su documentación

Estas son las convenciones seguidas para la revisión de escritura del código (PEP-8) y su documentación (PEP-257):

- [Lista de errores](https://pycodestyle.pycqa.org/en/latest/intro.html#error-codes) de PEP-8 con `pycodestyle`
- [Lista de errores](https://www.pydocstyle.org/en/stable/error_codes.html) de PEP-257 (*docstrings*) con `pydocstyle`
- [Formato NumPy](https://numpydoc.readthedocs.io/en/latest/format.html) para docstrings


## Ejecución del programa

El programa debe realizar y entregar todas las asignaciones sin ninguna intervención de la persona que lo ejecuta y revisa.

Los resultados mostrados en pantalla y las imágenes deben ser identificados apropiadamente, incluyendo títulos, numeración, rotulación de ejes, etc.

> Si no está indicado qué es un resultado, no existe

El programa tendrá una salida similar a lo siguiente en la terminal:

```bash
$ python B12345.py
Fecha inicio (YYYYMMDD): 20190101
Fecha final (YYYYMMDD): 20200101
¿Cuáles son los dígitos del carné?: 12345
Las horas asignadas son 19 y 7.

El modelo de distribución de consumo de
potencia para las 19 horas es rayleigh 
con parámetros (0.5).

La visualización de los datos se muestra
en la figura 1.

El índice de correlación de Pearson entre
la distribución de las 19 y las 7 horas es:
p = 0.4.

La visualización de los datos se muestra
en la figura 2.
```


In [None]:
import random

def asignacion_horas(digitos):
    '''Elige una hora A en periodo punta
    y una hora B de los otros periodos,
    con los dígitos del carné como "seed"
    '''
    
    random.seed(digitos)
    punta = [11, 12, 18, 19, 20]
    valle = [7, 8, 9, 10, 13, 14, 15, 16, 17]
    nocturno = [21, 22, 23, 0, 1, 2, 3, 4, 5, 6]
    otro = valle + nocturno
    hora_A = random.choice(punta)
    hora_B = random.choice(otro)
    return hora_A, hora_B

In [None]:
horas = asignacion_horas(12345)

print(f'Las horas asignadas son {horas[0]} y {horas[1]}.')

In [None]:
help(asignacion_horas)

---
**Universidad de Costa Rica** | Facultad de Ingeniería | Escuela de Ingeniería Eléctrica

&copy; 2023

---