<a href="https://colab.research.google.com/github/jurados/NotesPytorch/blob/main/%5B5%5D_Redes_Neuronales_Convolucionales.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import numpy as np
import matplotlib.pyplot as plt

import tensorflow as tf
from tensorflow import keras

# Redes Neuronales Convolucionales



Una Red Neuronal Convolucional (_Convulational Neural Networks_ con los acrónimos CNN o ConvNets) hacen la suposición explícita de que las entradas son imágenes, cosas que nos permiten codificar ciertas propiedades en la arquitectura para reconocer elementos concretos en las imágenes.

## Componentes Básicos de una Red Neuronal Convolucional

**Convolución:** La capa convulacional aprenden patrones locales dentro de la imagen en pequeñas ventadas de dos dimensiones.
El propósito principal de una capa convolucional es detectar características o rasgos visuales en las imágenes como aristas, líneas, gotas de color. Una vez aprendida una característica en un punto concreto de la imagen, la puede reconocer después en cualquier parte de la misma.
Las capas convulacionales pueden aprender jerarquías espaciales de patrones, preservando así relaciones espaciales.

En redes neuronales convolucionales se pueden usar diferentes longitudes de pasos de avance (el parámetro llamado ***stride***).

Se puede aplicar una ténica de relleno de ceros alrededor del margen de la imagen para mejorar el resultado del barrido que se realiza con la ventana que se va deslizando. El parámetro para definir este relleno recibe el nombre de ***padding***.

Para conectar cada neurona de la capa oculta con las neuronas que le corresponden a la capa de entrada se usa un valor de sesgo _b_ y una matriz de pesos _W_ de tamaño $5 \times 5$ que se llama _kernel_ o _filter_. El valor de cada punto de la capa oculta corresponde al producto escalar entre el filtro y el conjunto de las neuronas de la capa de entrada.

**Pooling:** Se puede traducir como "agrupación" que suelen ser aplicadas inmediatamente después de las capas convolucionales. Hacen una simplificación de la información recogida por la capa convolucional y crean una versión condensada de la información contenida en esta capa.
La más habitual y que se usa en casi todos es la conocida como _max-pooling_. También se puede utilizar _average-pooling_.

In [None]:
from tensorflow.keras import Sequential
from tensorflow.keras import layers
from tensorflow.keras.layers import Conv2D
from tensorflow.keras.layers import MaxPooling2D

In [None]:
model = Sequential()
model.add(Conv2D(filters=32,kernel_size=(5,5),strides=1,padding='valid',
          activation='relu',input_shape=(28,28,1)))
model.add(MaxPooling2D(pool_size=(2,2)))

In [None]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d (Conv2D)             (None, 24, 24, 32)        832       
                                                                 
 max_pooling2d (MaxPooling2  (None, 12, 12, 32)        0         
 D)                                                              
                                                                 
Total params: 832 (3.25 KB)
Trainable params: 832 (3.25 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [None]:
model.add(Conv2D(filters=64,kernel_size=(5,5),strides=1,padding='valid',
          activation='relu',input_shape=(28,28,1)))
model.add(MaxPooling2D(pool_size=(2,2)))
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d (Conv2D)             (None, 24, 24, 32)        832       
                                                                 
 max_pooling2d (MaxPooling2  (None, 12, 12, 32)        0         
 D)                                                              
                                                                 
 conv2d_1 (Conv2D)           (None, 8, 8, 64)          51264     
                                                                 
 max_pooling2d_1 (MaxPoolin  (None, 4, 4, 64)          0         
 g2D)                                                            
                                                                 
Total params: 52096 (203.50 KB)
Trainable params: 52096 (203.50 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [None]:
model.add(layers.Flatten())
model.add(layers.Dense(units=10, activation='softmax'))

In [None]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d (Conv2D)             (None, 24, 24, 32)        832       
                                                                 
 max_pooling2d (MaxPooling2  (None, 12, 12, 32)        0         
 D)                                                              
                                                                 
 conv2d_1 (Conv2D)           (None, 8, 8, 64)          51264     
                                                                 
 max_pooling2d_1 (MaxPoolin  (None, 4, 4, 64)          0         
 g2D)                                                            
                                                                 
 flatten (Flatten)           (None, 1024)              0         
                                                                 
 dense (Dense)               (None, 10)                1

In [None]:
from tensorflow.keras.utils import to_categorical

mnist = tf.keras.datasets.mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

train_images = train_images.reshape((60000,28,28,1))
train_images = train_images.astype('float32')/255

test_images = test_images.reshape((10000,28,28,1))
test_images = test_images.astype('float32')/255

train_labels = to_categorical(train_labels)
test_labels  = to_categorical(test_labels)

model.compile(loss='categorical_crossentropy',
              optimizer='sgd',
              metrics=['accuracy'])
model.fit(train_images, train_labels,batch_size = 100,
          epochs=5,verbose=1)

test_loss, test_acc = model.evaluate(test_images, test_labels)

print('Test Accuracy: ', test_acc)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Test Accuracy:  0.9697999954223633


**Tamaño y Número de Filtros:** El tamño de la ventana (*window_height* $\times$ *window_width*). Casi siempre es $3 \times 3$ o $5\times 5$. El número de filtros que nos indica el número de características que se quieren manejar (*output_depth*) que se acostumbra a ser de 32 a 64.

`Conv2D(output_depth, (window_height, window_width))`

**Padding:** Se usa cuando se quiere obtener un tensor de salida de las mismas dimensiones que la entrada. Se agregan ceros (_zero-padding_) alrededor de las imágenes de entrada antes de hacer deslizar la ventana por ella.

**Stride:** Indica el número de pasos en que se mueve la ventana de los filtros. Valores grandes de _stride_ grandes hacen decrecer el tamaño de la informaicón que pasará a la siguiente capa.

In [None]:
fashion_mnist = keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

class_names = ['T-shirt/top','Trouser','Fullover','Dress',
               'Coat','Sandal','Shirt','Sneker','Bag',
               'Ankle boot']

train_images = train_images.reshape((60000, 28,28,1))
train_images = train_images.astype('float32')/255

test_images = test_images.reshape((10000, 28,28,1))
test_images = test_images.astype('float32')/255

In [None]:
model = Sequential()
model.add(Conv2D(filters=32,kernel_size=(5,5),strides=1,padding='same',
          activation='relu',input_shape=(28,28,1)))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(Conv2D(filters=64,kernel_size=(5,5),strides=1,padding='same',
          activation='relu',input_shape=(28,28,1)))
model.add(MaxPooling2D(pool_size=(2,2)))
model.add(layers.Flatten())
model.add(layers.Dense(units=10, activation='softmax'))

model.compile(loss='sparse_categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])
model.fit(train_images, train_labels, epochs=5)

test_loss, test_acc = model.evaluate(test_images, test_labels)

print('Test Accuracy: ', test_acc)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
Test Accuracy:  0.9088000059127808


- La capa *BatchNormalization* la idea es normalizar las entradas de la capa de tal manera que tengan una activación de salida media de cero y una desviación estándar de uno.
- La capa *Dropout* ayuda a mitigar el sobreajuste de modelos. Se basa en ignorar ciertos conjuntos de neuronas de la red neuronal durante la fase de entrenamiento de manera aleatoria.

In [None]:
from tensorflow.keras.layers import Dropout, BatchNormalization
from tensorflow.keras.layers import Flatten, Dense

def make_model():
  model = Sequential()
  model.add(Conv2D(filters=32, kernel_size=(3,3),
                   activation='relu',strides=1,padding='same',
                   input_shape=(28,28,1)))
  model.add(BatchNormalization())

  model.add(Conv2D(filters=32, kernel_size=(3,3),
                   activation='relu',strides=1,padding='same'))
  model.add(BatchNormalization())
  model.add(Dropout(rate=0.25))

  model.add(Conv2D(filters=64, kernel_size=(3,3),
                   activation='relu',strides=1,padding='same'))
  model.add(MaxPooling2D(pool_size=(2,2)))
  model.add(Dropout(rate=0.25))

  model.add(Conv2D(filters=128, kernel_size=(3,3),
                   activation='relu',strides=1,padding='same'))
  model.add(BatchNormalization())
  model.add(Dropout(rate=0.25))

  model.add(Flatten())
  model.add(Dense(units=512, activation='relu'))
  model.add(BatchNormalization())
  model.add(Dropout(rate=0.5))
  model.add(Dense(units=128, activation='relu'))
  model.add(BatchNormalization())
  model.add(Dropout(rate=0.5))
  model.add(Dense(units=10, activation='softmax'))

  return model

In [None]:
model = make_model()

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=5)

test_loss, test_acc = model.evaluate(test_images, test_labels)
print('\nTest accuracy:', test_acc)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5

Test accuracy: 0.9254000186920166


_LearningRateScheduler_ coge la función de disminución de pasos como argumento y devuelve las tasas de aprendizaje actualizadas para usar en el optimizador en cada _epoch.

In [None]:
model = make_model()

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

reduce_lr = tf.keras.callbacks.LearningRateScheduler(lambda x: 1e-3 * 0.9**x)

model.fit(train_images, train_labels, epochs=30,
          callbacks=[reduce_lr])

test_loss, test_acc = model.evaluate(test_images, test_labels)
print('\nTest accuracy:', test_acc)

NameError: name 'rf' is not defined

Un `callbacks` es una herramienta para personalizar el comportamiento de un modelo de Keras durante el entramineto, evaluación o inferencia del modelo de Keras.