<a href="https://colab.research.google.com/github/RodolfoFerro/curso-ai-basics/blob/main/notebooks/session_06.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Redes neuronales artificiales con TensorFlow  🧠

## Contenido

### Sección IV

12. Introducción a redes neuronales
13. Productos matriciales - Composición de funciones
14. Idea intuitiva sobre la retropropagación
15. El problema de separabilidad lineal - XOR

### Sección V

16. Introducción a TensorFlow
17. Mi primera red neuronal
18. Función de pérdida y optimizador
19. Entrenamiento y predicciones

### Sección VI – Tarea

20. El dataset a utilizar
21. Preparación de los datos
22. Creación del modelo
23. Entrenamiento del modelo
24. Evaluación y predicción

## **Sección IV**

**IMPORTANTE**

El contenido de la sección IV ha sido descrito en su totalidad a través de la presentación.

Conviene revisar el material que puedes encontrar en el [repositorio](https://github.com/RodolfoFerro/curso-ai-basics).

## **Sección V**

### **Introducción a TensorFlow**

[TensorFlow](https://www.tensorflow.org/) es un framework open-source para Machine Learning desarrollada por Google. Utilizada para construir y entrenar redes neuronales artificiales.

In [None]:
import numpy as np


x = np.array([(0, 0), (1, 0), (0, 1), (1, 1)])
y = np.array([0, 1, 1, 0])

In [None]:
import tensorflow as tf


model = tf.keras.models.Sequential([
    tf.keras.layers.Dense(2, activation='tanh', input_shape=(2, )),
    tf.keras.layers.Dense(1, activation='sigmoid')
])

In [None]:
model.predict([[1, 1]])

### **Optimizador y función de pérdida**

In [None]:
loss = tf.keras.losses.MeanSquaredError()

$$ \mathrm{MSE}=\frac{1}{N}\cdot\sum_{i=1}^N \left(y_i- \hat{y}_i \right )^2 $$

In [None]:
loss([1], [0])

In [None]:
optimizer = tf.keras.optimizers.SGD(learning_rate=0.6)

model.compile(optimizer=optimizer, loss='mse', metrics=[loss])

In [None]:
model.summary()

In [None]:
history = model.fit(x, y, epochs=1000)

In [None]:
import plotly.express as px


losses = history.history['loss']
eje_x = np.arange(len(losses))

fig = px.line(
    x=eje_x,
    y=losses,
    title='Historia de entrenamiento',
    labels=dict(x='Épocas', y='Error')
)
fig.show()

In [None]:
# Construcción de una rejilla
x = np.linspace(-1, 1.5, 201)
y = np.linspace(-1, 1.5, 201)
xy = np.meshgrid(x, y)
zz = np.array(list(zip(*(x.flat for x in xy))))

# Predicción en la rejilla de valores
surface = model.predict(zz)
surface = surface.flatten()

In [None]:
import plotly.graph_objects as go


fig = go.Figure(data=[go.Scatter3d(
    x=zz[:, 0],
    y=zz[:, 1],
    z=surface,
    mode='markers',
    marker=dict(
        size=1,
        color=surface,
        colorscale='Viridis',
        opacity=0.8
    )
)])

# Tight layout
fig.update_layout(margin=dict(l=0, r=0, b=0, t=0))
fig.show()

<center>
    *********
</center>

## **Sección III – ¡Reto!**

### El dataset a utilizar: Fashion MNIST

El dataset está compuesto por imágenes de 28x28 pixeles, que contienen un conjunto de prendas en 10 categorías.


Los datos de Fashion MNIST están disponibles directamente en la API de conjuntos de datos de `tf.keras`. Los cargas así:

In [None]:
import tensorflow as tf
print(tf.__version__)

In [None]:
fashion_mnist = tf.keras.datasets.fashion_mnist

Llamar a `load_data` en este objeto nos dará dos conjuntos con los valores de entrenamiento y prueba para los gráficos que contienen las prendas y sus etiquetas.

In [None]:
(training_images, training_labels), (test_images, test_labels) = fashion_mnist.load_data()

¿Cómo se ven estos valores?

Imprimamos una imagen de entrenamiento y una etiqueta de entrenamiento para ver.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
np.set_printoptions(linewidth=200)


# Set index of image to be seen
img_index = 5999 # 6000 -1

# Plot image
plt.imshow(training_images[img_index], cmap='gray')
plt.axis(False)

print('Label:', training_labels[img_index])
print('Matrix:', training_images[img_index])

### Preparación de los datos

Notarás que todos los valores están entre 0 y 255. Si estamos entrenando una red neuronal, por varias razones es más fácil si transformamos los valores para tratar todos con valores entre 0 y 1. Este proceso se llama **normalización**.

In [None]:
training_images  = training_images / 255.0
test_images = test_images / 255.0

In [None]:
import numpy as np
import matplotlib.pyplot as plt
np.set_printoptions(linewidth=200)


# Set index of image to be seen
img_index = 3000 # 6000 -1

# Plot image
plt.imshow(training_images[img_index], cmap='gray')
plt.axis(False)

print('Label:', training_labels[img_index])
print('Matrix:', training_images[img_index])

In [None]:
training_images[0].shape

### Creación del modelo



In [None]:
mlp_model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(256, activation='relu'), # TODO. Dense -> 256, ReLU
    tf.keras.layers.Dense(10, activation='softmax') # TODO. Dense -> 10, Softmax
])

### Entrenamiento del modelo

Para entrenar el modelo, simplemente utilizamos el método `.fit()` del modelo.

In [None]:
mlp_model.compile(
    optimizer=tf.optimizers.SGD(),
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy']
)

In [None]:
history = mlp_model.fit(training_images, training_labels, epochs=3)


> **Pregunta clave:** ¿Qué sucede con la historia de entrenamiento?

In [None]:
import plotly.express as px


seen = 'accuracy' # or 'loss'

hist_values = history.history[seen]
eje_x = np.arange(len(hist_values))

fig = px.line(
    x=eje_x,
    y=hist_values,
    title='Historia de entrenamiento',
    labels=dict(x='Épocas', y=seen.capitalize())
)
fig.show()

### Evaluación del modelo

In [None]:
mlp_model.evaluate(test_images, test_labels)

### Predicción


In [None]:
import random

test_index = random.randint(0, 10000 - 1)

plt.imshow(test_images[test_index], cmap='gray')
plt.axis(False)

print('Label:', test_labels[test_index])
input_image = np.reshape(test_images[test_index], (1, 784))
prediction = mlp_model.predict(np.expand_dims(input_image, axis=-1))
print('Prediction:', np.argmax(prediction))

In [None]:
prediction

> **Para resolver la tarea, el reto es:** Mejor accuracy obtenido en la clase.

**Puedes explorar:**
- El número de capas.
- Las épocas de entrenamiento.
- Las funciones de activación.
- Investigar otras capas.

--------

> Contenido creado por **Rodolfo Ferro** (2024). <br>
> **Contacto:** [@rodo_ferro](https://www.instagram.com/rodo_ferro/)