# Redes neuronales con aplicaciones.

## ¿Que son las redes neuronales?

Las redes neuronales son algoritmos de aprendizaje automático supervisado que permiten aproximar una función $\mathbf{y} = F(\mathbf{x})$ desconocida 
empleando un conjunto de observaciones o mediciones de las variables $\mathbf{x}$ e $\mathbf{y}$.

### Las redes neuronales son algoritmos

Las implementaciones de las redes neuronales están incorporadas en programas.

#### Aplicaciones generales

* **Reconocimiento facial:** Se detectan las caras de las personas en las imágenes o videos. Se utiliza en una variedad de aplicaciones, como seguridad, control de acceso y publicidad.
* **Reconocimiento de voz:** Se detecta e identifica las voces humanas. Se utiliza en una variedad de aplicaciones, como asistentes virtuales, chatbots y sistemas de control por voz.
* **Traductores automáticos:** Se traduce texto de un idioma a otro. Son cada vez más precisos y se utilizan en viajes, comercio y educación.
* **Clasificación de imágenes:** Se asigna una clase o rótulo a una imagen dada. Se utiliza en una variedad de aplicaciones, como análisis de imágenes médicas, detección de objetos y clasificación de productos.
* **Generación de imágenes:** Este software utiliza redes neuronales para crear imágenes nuevas y realistas, con aplicaciones como diseño gráfico, entretenimiento y educación.
* **Juegos:** En juegos se utilizan redes neuronales para crear oponentes más desafiantes y entornos más inmersivos.
* **Ciberseguridad:** Se detectan amenazas cibernéticas y protegen los sistemas informáticos mediante clasificación de archivos y reconocimiento de patrones en secuencias de bits.
* **Metereología:**
  1. https://www.ecmwf.int/en/about/media-centre/aifs-blog/2023/ECMWF-unveils-alpha-version-of-new-ML-model
  2. https://www.ecmwf.int/en/about/media-centre/science-blog/2023/rise-machine-learning-weather-forecasting
  3. https://www.ecmwf.int/en/newsletter/174/earth-system-science/use-machine-learning-detection-and-classification
  4. https://www.ecmwf.int/en/about/media-centre/news/2023/how-ai-models-are-transforming-weather-forecasting-showcase-data

#### Ejemplos específicos

* **Face ID de Apple:** Este sistema utiliza redes neuronales para identificar a los usuarios de iPhone y iPad por su rostro.
* **Google Assistant:** Este asistente virtual utiliza redes neuronales para comprender las instrucciones de voz y responder a las preguntas.
* **Microsoft Translator:** Este traductor automático utiliza redes neuronales para traducir texto entre más de 100 idiomas.
* **TensorFlow:** Este marco de aprendizaje automático de código abierto de Google permite construir redes neuronales, entrenarlas y emplearlas.
* **OpenAI Five:** Este equipo de Dota 2 utiliza redes neuronales para jugar al juego de manera competitiva.
* **DeepMind AlphaGo:** Este programa de IA utilizó redes neuronales para derrotar al campeón mundial de Go, Lee Sedol.



### Aprendizaje automático supervisado

El aprendizaje automático o machine learning es un tema del campo de la inteligencia artificial, perteneciente a las ciencias de la cmputación.

Existen tres grandes variantes del aprendizaje automático:
1. Aprendizaje supervisado
2. Aprendizaje no supervisado
3. Aprendizaje por refuerzo (reinforced learning)

El aprendizaje automático supervisado nos permite construir un modelo determinado por un conjunto de datos de entrenamiento que contiene ejemplos de entradas $\mathbf{x}_{e}$ y salidas $\mathbf{y}_{e}$.
Para eso, el algoritmo tiene dos partes: el entrenamiento y la inferencia.

En el entrenamiento, se emplean los datos de entrenamiento $\mathbf{x}_{e}$ e $\mathbf{y}_{e}$ para obtener unos coeficientes $\mathbf{w}$
\begin{equation}
   \mathbf{w}_{k+1} = g(\mathbf{x}_{e}, \mathbf{y}_{e}, \mathbf{w}_{k}),
\end{equation}
donde $\mathbf{w}_{0}$ se inicializa con valores aleatorios.

El algoritmo $g(\mathbf{x}, \mathbf{y}, \mathbf{w})$ (también implementado en software) minimiza una función de pérdida o error (la diferencia entre la salida de la inferencia y la salida deseada)
\begin{equation}
L(\mathbf{x}_{e}, \mathbf{y}_{e}, \mathbf{w}_{k}) = \sum_{e} \left(f(\mathbf{x}_{e}, \mathbf{w}_{k}) - \mathbf{y}_{e}\right)^{2},
\end{equation}
para determinar el valor óptimo de $\mathbf{w}$. 

Una vez obtenido un valor adecuado de $\mathbf{w}$ con un valor suficientemente bajo de la función de pérdida, se detiene el entrenamiento y se guardan los coeficientes $\mathbf{w}$ para su uso en la fase de inferencia.

El aprendizaje automático supervisado se utiliza en una variedad de aplicaciones, como:

* **Clasificación:** Se utiliza para clasificar datos en categorías. Por ejemplo, se puede utilizar para clasificar imágenes en categorías de objetos o para clasificar correos electrónicos en categorías de spam o no spam.
* **Regresión:** Se utiliza para predecir un valor continuo. Por ejemplo, se puede utilizar para predecir el precio de una casa, para predecir la demanda de un producto, o en general para predecir los valores futuros de determinadas variables en función de los valores pasados.
* **Reconocimiento de patrones:** Se utiliza para identificar patrones en datos. Por ejemplo, se puede utilizar para identificar patrones de fraude o para identificar patrones de comportamiento de los clientes.

#### **Ejemplo**

Supóngamos que queremos desarrollar un modelo para clasificar imágenes de gatos y perros. Podemos recopilar un conjunto de datos de entrenamiento que contenga imágenes de gatos y perros, junto con etiquetas que indiquen si cada imagen es un gato o un perro. Podemos entrenar un modelo de aprendizaje automático supervisado en este conjunto de datos. El modelo aprenderá a asociar las características de las imágenes con la etiqueta correcta.

Una vez que el modelo esté entrenado, podemos utilizarlo para clasificar nuevas imágenes. El modelo predecirá si una imagen es un gato o un perro.

#### **Ventajas**

El aprendizaje automático supervisado tiene varias ventajas, entre ellas:

* **Es preciso:** Los modelos de aprendizaje automático supervisado pueden ser muy precisos.
* **Es fiable:** Los modelos de aprendizaje automático supervisado pueden ser fiables en entornos nuevos.
* **Es escalable:** Los modelos de aprendizaje automático supervisado se pueden escalar para manejar grandes conjuntos de datos.

#### **Desventajas**

El aprendizaje automático supervisado también tiene algunas desventajas, entre ellas:

* **Requiere un conjunto de datos de entrenamiento:** El modelo necesita ser entrenado en un conjunto de datos de entrenamiento.
* **Puede ser costoso:** La recopilación y el etiquetado de un conjunto de datos de entrenamiento puede ser costoso.
* **Puede ser sesgado:** El modelo puede aprender sesgos de los datos de entrenamiento.



## Implementación de redes neuronales

Las redes neuronales pueden implementarse empleando librerías de software como Tensorflow o Pytorch, que simplifican la definición de los modelos y el proceso de entrenamiento.

## https://www.tensorflow.org/

En este encuentro, vamos a ver la librería Tensorflow, que nos permite construir redes neurales, entrenarlas y usarlas para obtener una salida $\mathbf{y}$ dada una entrada $\mathbf{x}$.

En el sitio web https://www.tensorflow.org/ podemos ver tutoriales para muy diferentes aplicaciones. Ahora vamos a ver solo dos ejemplos, con la intención mostrar la relación entre las ecuaciones mostradas arriba y su traducción a software.

Además, en estos ejemplos veremos que la red neuronal es una parte de un programa mayor, pero por si sola carece de una interfase con los usuarios (un punto de encuentro, donde los datos entran y salen de la red neuronal). 

### Ejemplo 1

https://www.tensorflow.org/tutorials/images/classification

https://www.tensorflow.org/tutorials/load_data/images

Abajo vemos un programa en python que implementa una red neuronal para 
clasificar imágenes de flores.

Es una versión preparada para esta presentación. El original forma parte del 
tutorial de Tensorflow.

Usaremos un dataset de aproximadamente 3700 imágenes de flores. 
El dataset contiene cinco sub-directorios, uno por clase:

flower_photo/
  daisy/
  dandelion/
  roses/
  sunflowers/
  tulips/

Este programa esta dividido en dos partes, train.py y core.py

In [None]:
# train.py

from core import get_dataset, get_model, fit_model 
from pathlib import Path 

# Definitions
image_width, image_height, channels = 150, 150, 3
batch_size = 32

# Data
home = Path('~').expanduser()
data_directory = Path(home, 'Data', 'flower_photo', 'train')
saved_weights = Path(home, 'Data', 'weights', 'flowers.hf5')

# Model Initialization
model = get_model(image_heigth, image_width)

# Load data
train_dataset, validation_dataset = get_datasets(
    data_directory, image_width, image_height, batch_size)

# Training
fit_model(model, train_dataset, validation_dataset, epochs, saved_weights)


In [None]:
# core.py
import tensorflow as tf
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense
from keras import backend as K


def get_datasets(
    data_directory,
    image_width,
    image_height,
    batch_size):
    
    train_dataset = tf.keras.utils.image_dataset_from_directory(
        data_directory,
        validation_split=0.2,
        subset="training",
        seed=123,
        image_size=(image_height, image_width),
        batch_size=batch_size)

    validation_datasset = tf.keras.utils.image_dataset_from_directory(
        data_directory,
        validation_split=0.2,
        subset="validation",
        seed=123,
        image_size=(image_height, image_width),
        batch_size=batch_size)

    return train_dataset, validation_dataset


def get_model(image_height, image_width, number_of_classes):
    print('building model')
    model = Sequential([
       layers.Rescaling(1./255, input_shape=(image_height, image_width, 3)),
       layers.Conv2D(16, 3, padding='same', activation='relu'),
       layers.MaxPooling2D(),
       layers.Conv2D(32, 3, padding='same', activation='relu'),
       layers.MaxPooling2D(),
       layers.Conv2D(64, 3, padding='same', activation='relu'),
       layers.MaxPooling2D(),
       layers.Flatten(),
       layers.Dense(128, activation='relu'),
       layers.Dense(number_of_classes)
    ])

    model.compile(
        optimizer='adam',
        loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
        metrics=['accuracy'])
    
    return model


def fit_model(
        model, 
        train_dataset, 
        validation_dataset, 
        epochs,
        weights_filename):

    history = model.fit(
       train_dataset,
       validation_data=validation_dataset,
       epochs=epochs
    )    
    model.save_weights(weights_filename)
    return history



Estos programas en python emplean la libreria TensorFlow de Google para construir una red neuronal cuyo objetivo es clasificar imágenes. 

Dada una imagen digital $\mathbf{x}$ la red neuronal decide que flor contiene (es decir, $\mathbf{y}$ toma los valores posibles **daisy**, **dandelion**, **rose**, **sunflowers**, **tulip**.

#### Codificación de clases

¿Como es posible para la red neuronal indicar una flor determinada? Para esto empleamos un código: 

1. **daisy** -> $\left[1, 0, 0, 0, 0 \right]$.
2. **dandelion** -> $\left[0, 1, 0, 0, 0\right]$.
3. **rose** -> $\left[0, 0, 1, 0, 0\right]$.
4. **sunflower** -> $\left[0, 0, 0, 1, 0\right]$.
5. **tulip** -> $\left[0, 0, 0, 0, 1\right]$.

#### Todo bien con las flores, pero esta es una charla sobre redes neuronales aplicadas a metereología.

En realidad la red indica **perro** o **gato** porque recibe imágenes de perros y gatos. Si reemplazamos las imágenes empleadas en la fase de entrenamiento por otras (por ejemplo, imágenes satelitales) podemos usar el mismo modelo para la clasificación que nos interese. Los nombres **perro** y **gato** son rótulos que pueden cambiarse libremente, y el único motivo de su existencia es poder asignar a cada imagen una clase única representada con un vector $\left[ 1, 0 \right]$ o vector $\left[0, 1\right]$.

#### ¿Que pasa si aparece una imagen que no contiene un perro o un gato?

En realidad, las redes neuronales que se usan como funciones de clasificación se definen de forma tal que sus resultados correspondan a la probabilidad de la clase $\mathbf{y}$ dada la imagen $\mathbf{x}$. El vector $\left[ 1, 0 \right]$ indica que corresponde una probabilidad de $1$ a la primer clase, y una probabilidad de $0$ a la segunda clase.

Si recibimos una imagen de una ballena, la salida de la red neuronal será algo así como $\left[ 0.5, 0.5 \right]$ indicando que no es posible decidir entre una clase o la otra.

#### ¿Como podemos hacer para reemplazar las imágenes de perros y gatos por otras más interesantes?

En el archivo core.py podemos observar el uso de la función flow_from_directory.
Buscando en el manual de Tensorflow, podemos ver que esa función lee datos desde el disco rígido y los organiza en datasets para entrenamiento, validación y testeo. 

Podemos ver también que podemos almacenar nuestras imágenes en directorios, en una estructura similar a la requerida por la función flow_from_directory. De esta forma, las imágenes y las clases asignadas pueden ser modificadas a voluntad.

## Ejemplo 2:

https://www.tensorflow.org/tutorials/structured_data/time_series

El dataset (conjunto de datos) de variables metereológicas

Este tutorial usa un dataset construido por [el instituto de Biogeoquímica "Max Planck"].

Los datos contienen 14 características distintas (temperatura del aire, presión atmósferica, humedad, etc), registradas cada diez minutos, desde el año 2003. En el ejemplo, se usan datos entre 2009 y 2016.

In [None]:
# Descarga del dataset
zip_path = tf.keras.utils.get_file(
    origin='https://storage.googleapis.com/tensorflow/tf-keras-datasets/jena_climate_2009_2016.csv.zip',
    fname='jena_climate_2009_2016.csv.zip',
    extract=True)
csv_path, _ = os.path.splitext(zip_path)

**Es necesario filtrar, limpiar, y procesar los datos.**

En este caso, los datos vienen en una planilla csv.

Ejemplo: velocidad y dirección del viento, evolución del tiempo.

## Hardware para trabajar con redes neuronales

1. PC Gamer para entrenamiento (PC con GPU)
2. Placas NVIDIA (Jetson Nano y superiores) (Inferencia)
3. Raspberry PI 5 (Inferencia)

## El desarrollo de una aplicación con redes neuronales es un trabajo multidisciplinario

1. Metereologos definen el problema que se busca resolver con la aplicación, y preparan el dataset de entrenamiento, evaluación y testeo.
2. Ingenieros electrónicos trabajan con el hardware
3. Licenciados en informática trabajan con el software.
