<a href="https://colab.research.google.com/github/DarkCodex29/DarkCodex29/blob/main/Introducci%C3%B3n_a_las_redes_neuronales_convolucionales_con_TensorFlow_y_Keras.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Introducción a las redes neuronales convolucionales con TensorFlow y Keras

> **Rodolfo Ferro** <br>
> Google Dev Expert en ML, 2022.

## Contenidos

#### **Sección III**

1. **Bases:** Aprendizaje de neuronas
2. **Código:** Entrenamiento de una neurona
3. **Bases:** Conceptos importantes
4. **Bases:** Imágenes

#### **Sección IV**

4. **Bases:** El dataset de modas
5. **Código:** Preparación de datos
6. **Código:** Creación del modelo multicapa (MLP)
7. **Código:** Entrenamiento del modelo
8. **Código:** Evaluación y predicción

#### **Sección V**

9. **Bases:** Convoluciones
10. **Código:** Creación del modelo convolucional (CNN)
11. **Código:** Entrenamiento del modelo
12. **Código:** Evaluación y predicción


13. **Cierre:** Sesión de preguntas y respuestas

## **Sección III**

### Aprendizaje de neuronas

Veamos cómo se puede entrenar una sola neurona para hacer una predicción.

Para este problema construiremos un perceptrón simple, como el propuesto por McCulloch & Pitts, usando la función sigmoide.

#### **Planteamiento del problema:**

Queremos mostrarle a una neurona simple un conjunto de ejemplos para que pueda aprender cómo se comporta una función. El conjunto de ejemplos es el siguiente:

- `(1, 0)` debería devolver `1`.
- `(0, 1)` debe devolver `1`.
- `(0, 0)` debería devolver `0`.

Entonces, si ingresamos a la neurona el valor de `(1, 1)`, debería poder predecir el número `1`.

> ¿Puedes adivinar la función?

#### ¿Que necesitamos hacer?

Programar y entrenar una neurona para hacer predicciones.

En concreto, vamos a hacer lo siguiente:

- Construir la clase y su constructor.
- Definir la función sigmoidea y su derivada
- Definir el número de épocas para el entrenamiento.
- Resolver el problema y predecir el valor de la entrada deseada

In [None]:
import numpy as np


class sigmoid_neuron():
    def __init__(self, n):
        """Constructor of the class."""
        np.random.seed(123)
        self.synaptic_weights = None # TODO. Use np.random.random((n, 1)) to gen values in (-1, 1)

    def __sigmoid(self, x):
        """Sigmoid function."""
        # TODO.
        pass

    def __sigmoid_derivative(self, x):
        """Derivative of the Sigmoid function."""
        # TODO.
        pass

    def train(self, training_inputs, training_output, iterations):
        """Training function."""
        for iteration in range(iterations):
            output = self.predict(training_inputs)
            error = training_output.reshape((len(training_inputs), 1)) - output
            adjustment = np.dot(training_inputs.T, error *
                                self.__sigmoid_derivative(output))
            self.synaptic_weights += adjustment

    def predict(self, inputs):
        """Prediction function."""
        return self.__sigmoid(np.dot(inputs, self.synaptic_weights))

### Generando las muestras

Ahora podemos generar una lista de ejemplos basados en la descripción del problema.

In [None]:
# Training samples:
input_values = []   # TODO. Define the input values as a list of tuples.
output_values = []  # TODO. Define the desired outputs.

training_inputs = np.array(input_values)
training_output = np.array(output_values).T.reshape((3, 1))

### Entrenando la neurona

Para hacer el entrenamiento, primero definiremos una neurona. De forma predeterminada, contendrá pesos aleatorios (ya que aún no se ha entrenado):

In [None]:
# Initialize Sigmoid Neuron:
neuron = sigmoid_neuron(2)
print("Initial random weights:")
neuron.synaptic_weights

In [None]:
# TODO.
# We can modify the number of epochs to see how it performs.
epochs = 0

# We train the neuron a number of epochs:
neuron.train(training_inputs, training_output, epochs)
print("New synaptic weights after training: ")
neuron.synaptic_weights

### Haciendo predicciones

In [None]:
# We predict to verify the performance:
one_one = np.array((1, 1))
print("Prediction for (1, 1): ")
neuron.predict(one_one)

## **Sección IV**

### El dataset de modas

Comencemos importando TensorFlow.

In [None]:
import tensorflow as tf
print(tf.__version__)

Los datos de Fashion MNIST están disponibles directamente en la API de conjuntos de datos de `tf.keras`. Los cargas así:

In [None]:
fashion_mnist = tf.keras.datasets.fashion_mnist

Llamar a `load_data` en este objeto nos dará dos conjuntos con los valores de entrenamiento y prueba para los gráficos que contienen las prendas y sus etiquetas.

In [None]:
(training_images, training_labels), (test_images, test_labels) = fashion_mnist.load_data()

¿Cómo se ven estos valores?

Imprimamos una imagen de entrenamiento y una etiqueta de entrenamiento para ver.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
np.set_printoptions(linewidth=200)


# Set index of image to be seen
img_index = 5999 # 6000 -1

# Plot image
plt.imshow(training_images[img_index], cmap='gray')
plt.axis(False)

print("Label:", training_labels[img_index])
print("Matrix:", training_images[img_index])

### Preparación de los datos

Notarás que todos los valores están entre 0 y 255. Si estamos entrenando una red neuronal, por varias razones es más fácil si transformamos los valores para tratar todos con valores entre 0 y 1. Este proceso se llama **normalización**.

In [None]:
training_images  = training_images / 255.0
test_images = test_images / 255.0

In [None]:
import numpy as np
import matplotlib.pyplot as plt
np.set_printoptions(linewidth=200)


# Set index of image to be seen
img_index = 3000 # 6000 -1

# Plot image
plt.imshow(training_images[img_index], cmap='gray')
plt.axis(False)

print("Label:", training_labels[img_index])
print("Matrix:", training_images[img_index])

In [None]:
training_images[0].shape

### Creación del modelo



In [None]:
mlp_model = tf.keras.models.Sequential([
    tf.keras.layers.Flatten(), 
    # TODO. Dense -> 256, ReLU
    # TODO. Dense -> 10, Softmax
])

### Entrenamiento del modelo

In [None]:
mlp_model.compile(
    optimizer=tf.optimizers.SGD(),
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy']
)

In [None]:
model.summary()

In [None]:
mlp_model.fit(training_images, training_labels, epochs=3)

### Evaluación del modelo

In [None]:
mlp_model.evaluate(test_images, test_labels)

### Predicción


In [None]:
import random

test_index = random.randint(0, 10000 - 1)

plt.imshow(test_images[test_index], cmap='viridis')
plt.axis(False)

print("Label:", test_labels[test_index])
input_image = np.reshape(test_images[test_index], (1, 784))
prediction = mlp_model.predict(np.expand_dims(input_image, axis=-1))
print("Prediction:", np.argmax(prediction))

In [None]:
prediction

## **Sección V**

In [None]:
import numpy as np
from scipy import misc
import matplotlib.pyplot as plt


# We load a sample image
img = misc.ascent()

plt.imshow(img, cmap='gray')
plt.grid(False)
plt.axis('off')
plt.show()

In [None]:
img_transformed = np.copy(img)
size_x = img_transformed.shape[0]
size_y = img_transformed.shape[1]

In [None]:
# Let's experiment with different values

filter = [[1, 2, 1], [2, 4, 2], [1, 2, 1]]
# filter = [[-1, -2, -1], [0, 0, 0], [1, 2, 1]]
# filter = [[-1, 0, 1], [-2, 0, 2], [-1, 0, 1]]

weight = 1/8

In [None]:
for x in range(1, size_x - 1):
  for y in range(1, size_y - 1):
      convolution = 0.0
      convolution = convolution + (img[x - 1, y - 1] * filter[0][0])
      convolution = convolution + (img[x, y - 1] * filter[0][1])
      convolution = convolution + (img[x + 1, y - 1] * filter[0][2])
      convolution = convolution + (img[x - 1, y] * filter[1][0])
      convolution = convolution + (img[x, y] * filter[1][1])
      convolution = convolution + (img[x + 1, y] * filter[1][2])
      convolution = convolution + (img[x - 1, y + 1] * filter[2][0])
      convolution = convolution + (img[x, y + 1] * filter[2][1])
      convolution = convolution + (img[x + 1, y + 1] * filter[2][2])
      convolution = convolution * weight
      
      if convolution < 0:
        convolution = 0
      if convolution > 255:
        convolution = 255
      
      img_transformed[x, y] = convolution

In [None]:
plt.imshow(img_transformed, cmap='gray')
plt.grid(False)
plt.axis('off')
plt.show()

### Creación del modelo

Para este modelo se agregarán algunas capas convolucionales.

Como inspiración, podemos recrear LeNet5 de Yann LeCun:

<img src="https://miro.medium.com/max/4348/1*PXworfAP2IombUzBsDMg7Q.png">

In [None]:
cnn_model = tf.keras.models.Sequential([
                                    
    # First conv layer + subsampling
    tf.keras.layers.Conv2D(64, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    tf.keras.layers.MaxPooling2D(2, 2),

    # Second conv layer + subsampling
    # TODO. Conv2D -> 256, (3, 3), ReLU
    # TODO. MaxPool

    # Third layer (flatten)
    tf.keras.layers.Flatten(),

    # Fourth layer (dense)
    # TODO. Dense -> 128, ReLU

    # Fifth layer (output)
    tf.keras.layers.Dense(10, activation='softmax')
])

### Entrenamiento del modelo

In [None]:
cnn_model.compile(
    optimizer=tf.optimizers.SGD(),
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy']
)

In [None]:
model.summary()

In [None]:
cnn_model.fit(training_images, training_labels, epochs=2)

### Evaluación del modelo

In [None]:
cnn_model.evaluate(test_images, test_labels)

### Predicción


In [None]:
import random

test_index = random.randint(0, 10000 - 1)

plt.imshow(test_images[test_index], cmap='viridis')
plt.axis(False)

print("Label:", test_labels[test_index])
input_image = np.reshape(test_images[test_index], (1, 28, 28, 1))
prediction = cnn_model.predict(input_image)
print("Prediction:", np.argmax(prediction))

### Explora las siguientes situaciones

- Modifica el número de capas y parámetros de convolución por capa
- Modifica el número de épocas de entrenamiento
- Explora resultados con otros conjuntos de datos
- ¿Exportar modelos entrenados? Ojo: https://www.tensorflow.org/guide/keras/save_and_serialize?hl=es-419

In [None]:
# Guardar el Modelo
model.save('path_to_my_model.h5')

# Recrea exactamente el mismo modelo solo desde el archivo
new_model = keras.models.load_model('path_to_my_model.h5')