# Redes Neuronales para HPC - Taller 1
---

- **Fecha de entrega**: 2023-03-11
- **Tema**: Modelamiento en `jax` y GPGPU.
- **Enlace de entrega**: https://forms.gle/fGshDawEfQvf68LDA

In [None]:
import jax
import jax.numpy as jnp
from jax.typing import ArrayLike

## Creación del Conjunto de Datos
---

En este caso generaremos un conjunto de datos a partir de dos distribuciones normales. Para esto debe implementar la función `make_data`, la cual tiene las siguientes características:

**Parámetros**:

- `centroids`: matriz de `(2, 2)` donde cada fila representa un centroide de una distribución.
- `stds`: vector de `(2, )` donde cada valor representa la desviación estándar de cada distribución.
- `n_points`: número de puntos a generar de cada distribución.
- `seed`: semilla de números aleatorios.

**Retorna**:

- `features`: matriz de `(n_points * 2, 2)` con los puntos generados de las dos distribuciones.
- `labels`: vector de `(n_points * 2, )` con valores indicando a qué distribución pertenece cada punto.

> **Nota**: no olvide concatenar una columna de unos a la matriz $\mathbf{X}$.

In [None]:
def make_data(centroids: ArrayLike, stds: ArrayLike, n_points: int, seed: int) -> ArrayLike:
    features = ...
    labels = ...
    return features, labels

In [None]:
features, labels = make_data(
        centroids = jnp.array([
            [0., 0.],
            [1., 1.]
            ]),
        stds = jnp.array([1., 1.]),
        n_points = 1000,
        seed = 0
        )

## Función Logística
---

Debe implementar una función que dado un vector de pesos $\mathbf{w} \in \mathbb{R}^{2 \times 1}$ y una matriz de datos $\mathbf{X} \in \mathbb{R} ^ {N \times 2}$ genere la salida de una función logística:

$$
\tilde{\mathbf{y}} = \frac{1}{1 + e ^ {\mathbf{X} \cdot \mathbf{w}}}
$$

Para esto debe implementar la función `sigmoid`, con las siguientes especificaciones:

**Parámetros**:

- `features`: matriz $\mathbf{X}$.
- `weights`: vector de parámetros $\mathbf{w}$.

**Retorna**:

- `y_pred`: predicción del modelo $\tilde{\mathbf{y}}$.

In [None]:
def sigmoid(features: ArrayLike, weights: ArrayLike) -> ArrayLike:
    y_pred = ...
    return y_pred

In [None]:
weights = jnp.array([
    [0.],
    [0.]
    ])
y_pred = sigmoid(features, weights)

## Entropía Cruzada Binaria
---

Implemente la función de entropía binaria cruzada para medir qué tan cercanas están las predicciones $\tilde{\mathbf{y}}$ de las etiquetas originales $\mathbf{y}$:

$$
\mathcal{L} = \sum_{i = 1} ^ {N} y_i \log{\tilde{y_i}} + (1 - y_i) \log{(1 - \tilde{y_i})}
$$

Para esto debe implementar la función `binary_crossentropy`:

**Parámetros**:

- `y_true`: etiquetas del conjunto de datos.
- `y_pred`: predicciones del modelo.

**Retorna**:

- `loss`: valor de la entropía binaria.

In [None]:
def binary_crossentropy(y_true: ArrayLike, y_pred: ArrayLike) -> ArrayLike:
    loss = ...
    return loss

In [None]:
loss = binary_crossentropy(y_true=labels, y_pred=y_pred)

## Entrenamiento
---

Implemente la función `train`, la cual deberá utilizar las funciones anteriormente mencionadas para optimizar la entropía binaria cruzada. Debe determinar el valor de $\mathbf{w}$ que minimice dicha función por medio de diferenciación automática **autograd** y compilación de tipo **jit**.

**Parámetros**

- `features`: matriz de características $\mathbf{X}$.
- `labels`: etiquetas del conjunto de datos.
- `weights`: parámetros iniciales.
- `n_iters`: número de iteraciones.
- `learning_rate`: taza de aprendizaje para el algoritmo SGD.

**Retorna**:

- `weights`: parámetros optimizados.

In [None]:
def train(
    features: ArrayLike,
    labels: ArrayLike,
    weights: ArrayLike,
    n_iters: int,
    learning_rate: float,
    ) -> ArrayLike:
    weights = ...
    return weights

## Visualización
---

Genere una gráfica en dos dimensiones que muestre las regiones de decisión del modelo. Puede basarse en la que genera `sklearn`: https://scikit-learn.org/stable/modules/generated/sklearn.inspection.DecisionBoundaryDisplay.html